十年网站开发经验 + 多家企业客户 + 靠谱的建站团队
量身定制 + 运营维护+专业推广+无忧售后,网站问题一站解决
网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
创新互联主营天祝藏族自治网站建设的网络公司,主营网站建设方案,app开发定制,天祝藏族自治h5小程序开发搭建,天祝藏族自治网站营销推广欢迎天祝藏族自治等地区企业咨询
一、爬取数据
在此顺便提一下,可以到公众号菜单栏的学习福利里面逛逛。里面有些教程还是挺不错的。两个可以替代Python里urlib和re正则表达式的库,它们分别叫做requests和Ixml。
第一个库挺不错的,现在在获取网页源代码时,我都用这个库,大家如果有不懂的可以看看那个网站。第二个库由于我是用3.4版本的Python,折腾了很久没折腾进去,于是我发现了另一个不错的库BeautifulSoup,详细教程参考: Python爬虫入门八之Beautiful Soup的用法
有了requests和Beautifulsoup,基本上可以实现我想要的很多功能了。我便做了一一个抓取分级基金数据的爬虫:
二、分析并推送
其实在此分析其实还谈不上,顶多算是筛选。(不过我相信随着 我数学能力提升会能有进一步的分析的,美好的祝愿。。。)筛选很简单,就是涨幅或收益率等等满足一定条件就保留下来,保留下来干嘛?推送啊! ! !
将保存下来的数据通过邮件发送到自己的邮箱,手机上下载个软件,一切就大功告成了!
至此当时学习Python的目的就达到了,当时激动地要炸了
不过....那么好玩的东西,怎么能这么快就结束了?再折腾吧!
三、简单的界面
。Python好像不能直接弄成exe可执行文件,不能每次运行都开Python的窗口啊!强迫症怎么能忍! 1上网搜搜发现有诸如py2exe的包可以转换,可是老子是3.4版本啊! 折腾半天没搞定,算了!我不是会点VB吗,用那个吧。于是连界面都有了