爬行 表情包,爬虫表情动作,爬行 表情包,爬虫表情动漫
要爬取的内容:
具体的代码:#编码:utf-8 @版本:0.1 @作者:@ site:@ software:py charm @ file:情感演示。py @ time:2020-05-29 9:17 导入请求导入回复编号表情包地址# https://qq.yh31.com/zjbq/2920180.html#表情图片地址# https://QQ。yh31。com/TP/photo 7/ZJBQ/20101/2010 01 211740218681。gif #第一步,找到所要爬取图片的地址1.请求目标网站2.匹配不同图片地址(网址)3。找到所要爬取图片的地址 def get_urls(url): # 1 .请求目标网站response=requests.get(url) # 2 .通过正则来匹配不同图片地址(网址) #每张图片共有内容保留,不同的内容用。*?来匹配# .*:表示匹配任意数量不换行的字符# ?表示尽可能匹配最短的字符r img border= 0 alt= src=/TP/photo 7/ZJBQ/200909291701134159。gif URL _ add=r img .*?src=(即.*?) # url_add=rimg border=0 .* src=(0 .*?)" " # print(url_add) # 3 .找到所要爬取图片的地址url_list=re.findall(url_add,response。text)# print(URL _ list)return URL _ list #第二步,根据凭借完整的地址,下载图片数据def get_gif(url,name): # 1 .请求要爬取图片的URL响应=请求。获取(网址)# 2 .下载数据,保存到路径下E:\ 02 _ python 3.5 \ workspace \ pypc \ PC _ demo \ with open( E:\ \ 02 _ python 3.5 \ \ workspace \ \ pypc \ \ PC _ demo \ \ gif _ dir \ { } .格式(名称), wb )为英尺:英尺。写(回应。content)if _ _ name _ _= _ _ main _ _ :URL= https://QQ。yh31。com/zjbq/2920180。html URL _ list=get _ URLs(URL)#把列表当中的数据提取,并拼接成完整的图片全球资源定位器(统一资源定位器)地址对于url_list中的URL:# print(URL)gif _ name=URL[int(URL。rfind(/)]1:]# print(URL[int(URL。rfind(/))1:])# print(gif _ name)com _ URL= https://QQ。yh31。com URL print(com _ URL)#调用下载图片函数get_gif(com_url,gif_name)爬取结果:
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。