python读取音频文件,Python处理音频

  python读取音频文件,Python处理音频

  在数据爆炸的时代,各种数据都在快速增长,视频数据也不例外。我们可以用python从视频中提取音频,这个仅仅需要安装一个体量很小的python包,然后执行三行程序!

  语音数据在数据分析领域非常重要。比如可以分析语义,口音,情绪等等。它可以应用于偏好分析、测谎等。

  需要使用python包moviepy来提取音频。以下是moviepy的github地址:

  https://github.com/Zulko/moviepy

  安装python包来安装moviepy,cmd或者bash输入

  Pipinstallmoviepy提取音频假设有一个路径为 e:/chrome/my_video.mp4 的mp4文件,我们想提取它的音频保存到 e:/chrome/my_audio.wav ,那么三行程序就是:

  从moviepy.editor导入AudioFileClipmy _ audio _ clip=AudioFileClip( e:/chrome/my _ video . MP4 )my _ audio _ clip . write _ audio file( e:/chrome/my _ audio . wav )执行上述三行程序后,你会发现音频文件已经成功提取到指定文件夹~这里的视频格式和音频格式支持其他格式,比如读取m4v格式视频,保存MP3格式音频。这是我的电脑的一个例子:

  分析音频你可以用librosa包来分析音频。下面是librosa的github地址:

  https://github.com/librosa/librosa

  很多人学习python,却不知道从何入手。

  很多人学python,掌握了基本语法之后,不知道从哪里找案例入门。

  很多做过案例的人不知道如何学习更高级的知识。

  那么,针对这三类人,我会给你提供一个很好的学习平台,免费领取视频教程,电子书,以及课程的源代码!QQ群:810735403

  安装python包来安装librosa,cmd或者bash输入

  Pipinstalllibrosa需要说明,librosa包本身不支持MP3格式,需要一些相关包的支持。官网说使用康达安装会自动安装MP3支持的相关包。详情请到librosa的github地址。

  音频阅读假设有一个路径为 e:/chrome/my_audio.wav 的wav文件。看科普音频资料的内容,可以认为录制采样频率每个采样点的信号强度可以构成一个音频文件。数据流可以理解为一个数组,以字节为单位存储。

  我们来读一下音频。

  import librosaaudio,freq=librosa . load( e:/chrome/my _ audio . wav )time=NP . arange(0,len(audio))/freq print(len(audio),type(audio),freq,sep=\ T )下图是我的电脑的一个例子。可以看到读取的是采样频率每个采样点的信号强度,共2121210个采样点,频率22050,音频长度约96秒。

  Matplotlib绘制信号强度图bash输入

  将plotlib.py plot导入为pltfig,ax=plt.subplots () ax.plot (time,audio) ax.set (xlabel= time (s),y label= sound amplity )PLT . show()下图是我的电脑的一个例子:

  Librosa画了一个信号强度图。当然,我们可以使用librosa库的工具来分析它,我们可以在音频的开头和结尾修剪其他信息。绘制信号强度图的方法如下:

  从音频信号导入librosa.displayaudio,_=librosa . effects . Trim(audio)# Trim前导和尾随# silence . librosa . display . wave plot(audio,sr=freq)plt.show()

  下图是我的电脑的一个例子:

  在这里,我想推荐一下我自己的Python开发交流学习(qq)群:810735403。都是学Python开发的。如果你正在学习Python,欢迎你的加入。大家都是软件开发党,不定期分享干货(仅与Python软件开发相关),包括我自己编的一本2021最新的Python高级资讯与高级开发教程。欢迎有进阶的,想深入Python的!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: