python从视频中提取音频,Python处理音频

  python从视频中提取音频,Python处理音频

  开头提取音频,安装python包,提取音频分析,安装python包,读取音频,matplotlib,绘制信号强度图,librosa,绘制信号强度图,开头写,在数据爆炸的时代,各种数据都在飞速增加,视频数据也不例外。我们可以用python把视频中的音频提取出来,但是这个只需要安装一个小的python包,然后执行三行程序就可以了!

  语音数据在数据分析领域非常重要。比如可以分析语义,口音,情绪等等。它可以应用于偏好分析、测谎等。

  音频提取需要python包moviepy,这里是moviepy的github地址。

  安装python包来安装moviepy,cmd或者bash输入

  安装Moviepy提取音频假设有一个路径为 e:/chrome/my_video.mp4 的mp4文件,我们想提取它的音频保存到 e:/chrome/my_audio.wav ,那么三行程序就是:

  从moviepy.editor导入AudioFileClipmy _ audio _ clip=AudioFileClip( e:/chrome/my _ video . MP4 )my _ audio _ clip . write _ audio file( e:/chrome/my _ audio . wav )执行上述三行程序后,你会发现音频文件已经成功提取到指定文件夹~这里的视频格式和音频格式支持其他格式,比如读取m4v视频和保存MP3音频。这是我的电脑的一个例子。

  分析音频。可以用librosa包分析音频。这里是librosa的github地址。

  安装python包来安装librosa,cmd或者bash输入

  安装librosa需要说明,librosa包本身不支持MP3格式,所以需要一些相关包的支持。官网说使用康达安装会自动安装MP3支持的相关包。详情请到librosa的github地址。

  音频阅读假设有一个路径为 e:/chrome/my_audio.wav 的wav文件。看科普音频资料的内容,可以认为录制采样频率每个采样点的信号强度可以构成一个音频文件。数据流可以理解为一个数组,以字节为单位存储。

  我们来读一下音频。

  import librosaaudio,freq=librosa . load( e:/chrome/my _ audio . wav )time=NP . arange(0,len(audio))/freq print(len(audio),type(audio),freq,sep=\ T )下图是我的电脑的一个例子。可以看到读取的是采样频率每个采样点的信号强度,共2121210个采样点,频率22050,音频长度约96秒。

  Matplotlib绘制信号强度图bash输入

  将plotlib.py plot导入为pltfig,ax=plt.subplots () ax.plot (time,audio) ax.set (xlabel= time (s),ylabel= sound amplity )PLT . show()下图是我的电脑的一个例子:

  Librosa画了一个信号强度图。当然,我们可以使用librosa库的工具来分析它,我们可以在音频的开头和结尾修剪其他信息。绘制信号强度图的方法如下:

  Import librosa.displayaudio,_=librosa . effects . trim(audio)# trim leading and trailing # silence from a audio signal . librosa . display . wave plot(audio,Sr=freq) PLT.show()下图是我的电脑的一个例子:

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: