Python爬取小说,python爬取网络小说

  Python爬取小说,python爬取网络小说

  说明

  语言是一种在可扩展置标语言文档中搜索信息的语言。

  过程

  1、获得浏览器中的标题和作者测试。

  2、在浏览器安装语言插件:

  3、在超文本标记语言中找到预订-中间信息:

  4、找到我们想得到小说的名字、作者

  即//div[@ class= book-mid-info ]/H4/a/txt()http://www . Sina.com/

  #作者:

  #开发时间:2021/4/8/00088:24

  导入请求

  fromlxmlimportetree

  URL= https://www。启点。 com/rank/yue Piao

  headers={ user-agent : Mozilla/5.0(windows nt 10.0;WOW64)AppleWebKit/537.36(KHTML,像壁虎)Chrome/70。0 .3538 .25 safari/537.36 core/1。70 .3861 .400 QQ浏览器/10。7 .4313 .400 }

  #发送请求

  resp=requests.get(url,headers)

  e=etree .HTML(响应文本)#类型转换,把潜艇用热中子反应堆(海底热反应堆的缩写)转变为classlxml.etree._ELement

  打印(类型(e))

  names=e . XPath(//div[@ class= book-mid-info ]/H4/a/text())

  authors=e . XPath(//p[@ class= author ]/a[1]/text())

  打印(姓名)

  印刷品(作者)

  #名称和作者对应

  姓名,作者邮编(姓名,作者):

  打印(姓名,":",作者)以上就是大蟒中使用路径语言爬取小说的方法,希望对大家有所帮助。更多计算机编程语言学习指路:python基础教程实例

  本文教程操作环境:windows7系统、Python 3.9.1、戴尔自交第三代电脑。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: