python爬取漫画,看漫画学python

  python爬取漫画,看漫画学python

  爬网URL=https://www。u17。com/chapter/26636。html # image _ id=221085

  登上充满妖气的漫画,本人的谷歌浏览器获取的信息:

  位置选择器:#cur_img_221085

  属性位置:在特克斯和凯科斯群岛漫画_阅读_img框下

  开始爬取

  URL= https://www.u17.com/chapter/26636.html # image _ id=221085 resp=请求。获取(URL)打印(resp。teted)因此,可以判断该部分图片图像是由射流研究…动态地生成的。

  原因:请求获取静态超文本标记语言语句的内容

  当然,动态加载的网页也可以自然地爬上去

  准备:

  点安装序列号

  下载幻象

  下载地址:https://幻影js.org/download.html

  或http://NPM .陶js /

  环境变量小路加入phantomjs/lhzdll即可

  importrequestsfrombs 4 importbeautifulsoufromseleniumimportwebdriverpic _ list=[]URL= https://www .u17。com/chapter/(3359 image _ id=8108355 driver=web driver。幻影js(executable _ path= d 3360/program files(x86)/幻影js) html。解析器’)结果=汤。find _ all)img)、class _= image _ cache loading )for img _ srcinresult 3360 if img _列表605.1.15 ) khtml,像壁虎)版本/13.0.3移动/15e 148 safari connection : keep-alive } for img _ src in pic _ list:count=1 resp=requests。get(img _ src)f=open WB )f . write(resp。续)但是,当前的硒版本将放弃幻象,但不影响程序的运行

  用户警告:seleniumsupportforphantomjshasbeen已弃用已被否决,请使用请参见headlessversionsofchromeorfirefox而不是warnings。瓦拉德

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: