python怎么从网站下载音频,python读取音频文件
使用Python爬虫的例子——自动下载网页音频文件,利用库目标网站获取并解析网页源代码,访问下载链接
使用库请求
用于发送http请求。美丽的声音
一个灵活方便的网页解析库,处理效率高,支持多种解析器。
使用它,我们可以轻松地捕获web信息,而无需编写正则表达式。以及安装和介绍:pip安装请求spip安装美汤导入请求从bs4导入美汤作为BF目标网站
一个需要手动点击下载mp3文件的网站,因为需要下载数百个文件,所以手动操作很困难。
并获取网页的源代码。首先,我们使用请求来获取目标网站的源代码。
r=requests . get( 3358 www.goodkejian.com/ertonggushi.htm)观察发现,所有的下载链接都存储在a/a标签中,其长度是固定的。并且观察到链接不能直接访问下载地址,而是amp移除后可以直接下载。
所以我们首先使用BeautifulSoup来解析网页内容并从中提取a/a标签:
Soup=bf (r.text, html . parser )RES=soup . find _ all( a )访问下载链接。完成上述步骤后,res成为一个包含所有目标标签的数组。要下载网页上的所有mp3文件,只需要将RES中的元组循环转换成字符串,过滤并剪成链接,然后就可以请求访问了,返回值就是mp3文件。
所有代码如下:
来自bs4的导入请求import beautiful soup as bfr=requests . get( http://www . good kejian . com/ertonggushi . htm )soup=BF(r . text,html . parser )res=soup . find _ all( a )recorder=1 #长度为126的那个是I在RES中的图标:dst=str (i) if dst。_ _ len _ _()==126:URL 1=dst[9:53 URL 2=dst[57:62]URL=URL 1 URL 2 print(URL)xjh _ request=requests . get(URL)with open(。/res/ str(记录器)。rar , WB )as file:file . write(xjh _ request . content)file . close()recorder=1 print( ok )
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。