python爬取漫画,看漫画学python
爬网URL=https://www。u17。com/chapter/26636。html # image _ id=221085
登上充满妖气的漫画,本人的谷歌浏览器获取的信息:
位置选择器:#cur_img_221085
属性位置:在特克斯和凯科斯群岛漫画_阅读_img框下
开始爬取
URL= https://www.u17.com/chapter/26636.html # image _ id=221085 resp=请求。获取(URL)打印(resp。teted)因此,可以判断该部分图片图像是由射流研究…动态地生成的。
原因:请求获取静态超文本标记语言语句的内容
当然,动态加载的网页也可以自然地爬上去
准备:
点安装序列号
下载幻象
下载地址:https://幻影js.org/download.html
或http://NPM .陶js /
环境变量小路加入phantomjs/lhzdll即可
importrequestsfrombs 4 importbeautifulsoufromseleniumimportwebdriverpic _ list=[]URL= https://www .u17。com/chapter/(3359 image _ id=8108355 driver=web driver。幻影js(executable _ path= d 3360/program files(x86)/幻影js) html。解析器’)结果=汤。find _ all)img)、class _= image _ cache loading )for img _ srcinresult 3360 if img _列表605.1.15 ) khtml,像壁虎)版本/13.0.3移动/15e 148 safari connection : keep-alive } for img _ src in pic _ list:count=1 resp=requests。get(img _ src)f=open WB )f . write(resp。续)但是,当前的硒版本将放弃幻象,但不影响程序的运行
用户警告:seleniumsupportforphantomjshasbeen已弃用已被否决,请使用请参见headlessversionsofchromeorfirefox而不是warnings。瓦拉德
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。