python实用案例,python经典实例
要爬网的网址:
www.zdqx.com/qingchun/index.html 33558号
不用说,直接坐代码:
import requestsimport re,OS headers={ user-agent : Mozilla/5.0(windows nt 10.0;WOW64 ) appleWebKit/537.36(khtml,像壁虎一样)chrome/78。0 .3904 .108 safari/537.36)、 referer 3360 3358 www hm _ lpvt _ 303 a 32038183 ef a6 D8 efec 90 c 0031 b 87=1581472912 } def get _ URLs(URL,num _ page)3360 FIEs)) target= _ blank title=(.*?()、str(结果)、re .S ) pagenumlist=re.findall)、em class=(page _ num)共).*?(张/em)、str(结果)、re .S ) for urlAndTitle,numinzip ) urlstitlelist,pagenum list(:URL= http: urlAndTitle(0)title=urlAndTitle)1)num=int)for page in range(1)1,num 1):if page==1:new URL=URL else:new URL=URL。替换(. html , _ % s . html % page requ sp=hell(/div),resp.text,re .S ) URL_alt=re.findall ) imgsrc= .*?()、str(div_main)、re .s))长度为3 _ URL= http: URL _ alt(1)img title=titlestr)page)savedata)headers=headers(response。编码=响应。apparent _ encoding with open(path / title ).jpg),mode= WB (f . close))def download _ page(num _ page):if num _ page==1:URL= http://www.zdqx.com/com索引_str(num_page).html get _ URL)URL,num_page ) print ) (num_page)页面收集完毕(def main _ def main)(共1-42页),键入"全部"可获得约10000张高清壁纸:(n))if)want _ page=(all))3360 for page in range(1,41):download _ page(page)try:num _ page=int)want _ page)除:打印(您的输入无效,纯数字或字符串全部)请重新输入(main _ run)(if(num _ page 1或num _ page 42):print))您的输入无效,页码只能在一到42之间。请重新输入()(main_run ) ) else33332
虽然取大约10000张高清晰度图像已经太晚了,但是取一页的时间总算可以接受。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。