Python爬取抖音短视频,python抓取抖音数据
前言中的文字和图片均来自互联网,仅供学习交流,无商业用途。如有问题,请及时联系我们进行处理。
PS:如果需要Python学习资料,可以点击下面的链接自行获取。
Python免费学习资料和群发解决方案可以点击加入。
python开发环境
Python 3.6 pycharm导入请求# pip安装请求目标网页分析
都是漂亮的小姐姐,爱,爱~
我想把这些小姐姐的自拍视频都打包带回家~
网站加载了动态数据,相关数据包可以在开发者工具中找到。
有昵称,有标题,有封面,有视频地址,复制的视频地址会自动下载,你只需要模拟这个请求就可以得到相应的数据。
导入请求import pprinturl= https://v . 6 . cn/mini video/getminivideolist . PHP?act=re commend page=1 pagesize=30 headers={ user-agent : Mozilla/5.0(Windows NT 10.0;WOW64) AppleWebKit/537.36 (KHTML,像壁虎一样)Chrome/81 . 0 . 4044 . 138 Safari/537.36 } response=requests . get(URL=URL,headers=headers)html _ data=response . JSON()pprint . pprint(html _ data)
返回的是json数据,所以我们可以根据字典值的方法得到视频地址~
pprint格式化输入模块,让返回的数据看清楚。
解析数据以获得Li在lis中的视频地址和标题lis=html _ data[ content ][ list ]:title=Li[ title ]play _ URL=Li[ play URL ]print(title,play _ URL)
获得视频地址后,您可以请求视频地址并保存它。
response _ 2=requests . get(URL=play _ URL)path= d:\ \ Python \ \ Demo \ \六间房视频\ \ Title .mp4 with Open (path,mode= WB) as F: F. Write
保存的视频可以播放,但这只是一页数据。边肖对这个丢失的视频肯定不满意~
如何实现翻页和抓取?有必要对数据接口的url变化进行分析。
刘芳芳网站的数据加载是瀑布式的数据加载方式,与点击下一页不同。它需要你向下滑动,然后数据就会为你出现。
你可以清楚的看到,换页对应的是页码。
所以我们只需要替他循环浏览网址,从而达到翻页的效果。
完整代码导入请求导入范围(1,11)中页面的pprint:URL= https://v . 6 . cn/mini video/getminivideolist . PHP?act=recommended page={ } pagesize=30 。format(page)headers={ user-agent : Mozilla/5.0(Windows NT 10.0;WOW64) AppleWebKit/537.36 (KHTML,像壁虎一样)Chrome/81 . 0 . 4044 . 138 Safari/537.36 } Response=requests . get(URL=URL,headers=headers)html _ data=Response . JSON()lis=html _ data[ content ][ list ]for Li in lis:Title=Li[ Title ]play _ URL=Li[ play URL ]Response _ 2=requests . get(URL=play _ URL
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。