python爬虫大学排名,中国大学排名网络爬虫
大家好,本篇文章主要讲的是用大蟒爬取中国大学排名网站排名信息,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
程序解决问题如下:
利用大蟒网络爬虫爬取中国大学排名网站上的排名信息,将排名前20的大学的信息保存为文本文件,并在窗口打印出这20所大学的信息,按列打印和保存。
程序代码如下:
导入请求
从bs4导入美丽的声音
导入bs4
def getHTMLText(url):
尝试:
r=requests.get(url,timeout=30)
r.raise_for_status()
编码=表观编码
回复短信
例外:
返回""
def fillUnivList(ulist,html):
soup=BeautifulSoup(html, html.parser )
for tr in soup.find(tbody )儿童。
if isinstance(tr,bs4.element.Tag):
tds=tr(td )
hdfd=tds[0].查找(“div”)
tt=hdfd.string.split()
ff=" .加入(tt)
attr=tds[1].查找(“甲”)
hh=tds[4].string.split()
hg=" .加入(hh)
shf=tds[2].text.split()
shfn=" " .加入(shf)
ulist.append([ff,attr.string,shfn,hg])
def printUnivList(ulist,num):
tplt={0:^10}\t{1:{4}^10}\t{2:^10}\t{3:^10}
print(tplt.format(排名,学校名称,省份,总分,chr(12288)))
用打开( save.txt , w ,编码=utf-8 )作为f:
f.write(tplt.format(排名,学校名称,省份,总分,chr(12288)))
f.write(\n )
对于范围(编号):内的我
u=ulist[i]
print(tplt.format(u[0],u[1],u[2],u[3],chr(12288)))
with open(save.txt , a ,encoding=utf-8) as f:
f.write(tplt.format(u[0],u[1],u[2],u[3],chr(12288)))
f.write(\n )
定义主():
用打开( save.txt , w ,编码=utf-8 )作为f:
f.write(排名,学校,省份,总分\n )
f.close()
uinfo=[]
URL= https://www。上海排名。 cn/rankings/bcur/2021
html=getHTMLText(url)
填充通用列表(uiinfo,html)
打印通用列表(uiinfo,20)
主()
程序运行结果如下:
到此这篇关于用大蟒爬取中国大学排名网站排名信息的文章就介绍到这了,更多相关大蟒爬取中国大学排名信息内容请搜索盛行信息技术软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行信息技术软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。