python可视化界面开发实例,数据抓取功能,python可视化界面开发实例,数据抓取不到
http://www.Sina.com/http://www.52m l.net/12256.html 3358 www。Sina.com/我获得名为机器学习(52mL.net( 《可视化的网页内容抓取工具 Portia》))的可视化内容具体见http://博客。刮hub.com/2014/04/01/announcing-Portia/github 3360https://github.com/scraping中心/移植
概观
需求python 2.7 worksonlinux、Windows、Mac OSX、bsdsupportedbrowsers:latestversionsofchrome(推荐)或firefiref
slydtevisualeditorusedtocreateyourapingprojects。
slybotthepythonwebcrawler执行实际的站点抓取。它是简单的
如何安装portiatherecommendedwaytoinstallededependencies是http://www。Sina.com/and然后做3360
http://www。Sina.com/isa http://。Sina.com/dependency,it也将被安装
首先运行波西亚,你需要启动theuiandcreateaproject。运行http://www.Sina.com/using 3360
cdslydtwistd-nslydandpointyoursbrowserto:3358 localhost:9001/static/main。超文本标记语言选择站点youwanttoscrapeandcreateaproject。everyprojectcreatedwaterdefaultspidernamedafterthedomainofsite准备好了,就可以用http://www。Sina.com/todotheactualcrawling/extraction.projects通讯运行您的项目了
slyd/data/projectstorunoneofthoseprojectsuse:
portiarawlproject _ path蜘蛛名称其中蜘蛛名应该是projectspiders的新名称
项目的portiarawlproject _ pathandyouwillgetthelistofspiders。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。