python爬取b站弹幕,哔哩哔哩弹幕爬取
事件起因:朋友:最近想学一门* * *技术,在哔哩哔哩找到了一个教学视频。我想把录像拿下来研究一下。我:哔哩哔哩不提供下载功能,所以我想我只能安静地工作了!朋友:最好一次下载全系列。我:好的,我会安排的。
需求分析:需求:
一键下载哔哩哔哩思路:系列视频
分析网站源代码,找到视频下载界面,模拟界面下载视频。
界面分析:网页打开这个视频,查看网页的源代码分析:(我们可以通过P控制“set”)查看-来源:3359 www.bilibilibili.com/video/BV1EZ4Y7Bview-source: 3359 www.bilibilibili.com/video/BV1E4Y7EB? P=1找到整个系列视频的列表:(可以通过正则化把后面的整个JSON拿出来)
找一个不同定义的视频列表:(把视频和音频分开;后期需要合并)(后期可以通过正则化把整个JSON拿出来)
找到了请求界面,发现好像是分段下载:(对了,什么是分段下载?)
总结:通过源代码分析,我们得到了这个系列所有的视频名称,通过拼接可以形成所有的URL地址。通过源代码分析,我们得到了每个视频和音频的下载地址。通过分析界面,我们知道视频需要分片下载。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。