Python爬取小说,python爬取网络小说
说明
语言是一种在可扩展置标语言文档中搜索信息的语言。
过程
1、获得浏览器中的标题和作者测试。
2、在浏览器安装语言插件:
3、在超文本标记语言中找到预订-中间信息:
4、找到我们想得到小说的名字、作者
即//div[@ class= book-mid-info ]/H4/a/txt()http://www . Sina.com/
#作者:
#开发时间:2021/4/8/00088:24
导入请求
fromlxmlimportetree
URL= https://www。启点。 com/rank/yue Piao
headers={ user-agent : Mozilla/5.0(windows nt 10.0;WOW64)AppleWebKit/537.36(KHTML,像壁虎)Chrome/70。0 .3538 .25 safari/537.36 core/1。70 .3861 .400 QQ浏览器/10。7 .4313 .400 }
#发送请求
resp=requests.get(url,headers)
e=etree .HTML(响应文本)#类型转换,把潜艇用热中子反应堆(海底热反应堆的缩写)转变为classlxml.etree._ELement
打印(类型(e))
names=e . XPath(//div[@ class= book-mid-info ]/H4/a/text())
authors=e . XPath(//p[@ class= author ]/a[1]/text())
打印(姓名)
印刷品(作者)
#名称和作者对应
姓名,作者邮编(姓名,作者):
打印(姓名,":",作者)以上就是大蟒中使用路径语言爬取小说的方法,希望对大家有所帮助。更多计算机编程语言学习指路:python基础教程实例
本文教程操作环境:windows7系统、Python 3.9.1、戴尔自交第三代电脑。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。