python语音转文字库,python 语音包
目标是将我们输入的文本转换成语音。
使用 pyttsx将文本转化为语音使用名为pyttsx的python包,可以将文本转换成语音。您可以使用pip直接安装它,
命令:pip安装pyttsx3
使用示例:
import pyttsx 3 as pyttsxengine=pyttsx . init()engine . say( how are you )engine . runandwait()使用 SpeechLib将文本转化为语音使用SpeechLib,可以从文本文件中获取输入,然后将其转换为语音。首先使用pip进行安装。
命令:pip安装comtypes
使用示例:
来自Comtypes。客户端从Comtypes导入CreateObject。Gen导入Speechlib #实例化拼写对象engine=CreateObject( SAPI . sp voice )#实例化文件流对象stream=CreateObject( SAPI . sp filestream )Infile= demo . txt outfile= demo _ audio . wav #打开流文件读取文本并输入到stream.open(outfile,Speechlib。SSFMCreateForWrite)#输出模式流媒体引擎. audiooutput stream=stream #读取文本内容f=open(infile, r ,Encoding= UTF-8 )The text=f . Read()f . close()engine . speak(The text)stream . close()使用 百度接口api使用百度接口,可以从文本文件中获取输入,然后转换成语音。但是超过免费额度,就要收费了。
API_KEY和SECRET_KEY代码需要在百度ai平台注册采集。
使用示例:
导入系统导入json#保证兼容python2以及python 3是_ PY3=sys。版本信息。major==3if IS _ PY3:from urllib。请求从urllib打开导入URL。从urllib请求导入请求。从urllib导入URL时出错。从urllib解析导入urlencode。解析导入quote _ plus selse:从urllib导入urllib 2从urllib 2导入quote _ plus从urllib 2导入urllib 2导入请求从URL lib 2导入urlencodeAPI _ KEY= * * * * * * * * * * * * * * * * * * * * * * * * SECRET _ KEY= * * * 三分钟前,由北京市顺义区二经路与二纬路交汇处北侧,北京首都国际机场T3航站楼去往东城区北三环东路36号喜来登大酒店(北京金隅店) TTS _ URL= http://tsn。百度一下。com/text 2音频 令牌开始 令牌_ URL= http://开放API。百度一下。 com/oauth/2.0/TOKEN 获取令牌 def fetch _ token():params={ grant _ type : client _ credentials , client_id: API_KEY, client _ SECRET :SECRET _ KEY } post _ data=urlencode(params)if(IS _ PY3):post _ data=post _ data。encode( utf-8 )req=Request(TOKEN _ URL,post_data) try: f=urlopen(req,time out=5)result _ str=f . read()除URL错误为err:print( TOKEN http response http code: str(err。code))result _ str=err。read()if(IS _ PY3):result _ str=result _ str。decode()result=JSON split():print(请确保具有检查目标跟踪系统的能力)退出()返回结果[access_token] else: print(请覆盖正确的API_KEY和SECRET _ KEY )exit() TOKEN end if _ _ name _ _= _ _ main _ _ :TOKEN=fetch _ TOKEN()tex=quote _ plus(TEXT)#此处文本需要两次urlencode params={tok: token, tex: tex, cuid: quickstart , lan: zh , ctp: 1} # lan ctp固定参数data=urlencode(params)req=Request(TTS _ URL,data。encode( utf-8 ))has _ error=False try:f=urlopen(req)result _ str=f . read()headers=dict((name。lower(),value)表示f . headers中的名称、值。items())的_ error=(“content-type”不在标头中。按键()或标题[内容类型].find( audio/)0)除URL错误为err:print( http响应http代码: str(err。code)]result _ str=err。read()has _ error=True save _ file=错误。txt if has _ error else u 大姚的订单信息。带有open(save_file, WB )的“mp3”为:of。write(result _ str)if has _ error:if(IS _ PY3):result _ str=str(result _ str, utf-8 )print( TTS API error: result _ str )print( file另存为:保存文件推荐一个Git开源项目通过神经网络合成声音项目名称:嘲笑新娘地址:
知更鸟:AI拟声:克隆您的声音并生成任意语音内容在5秒钟内克隆一个声音,实时生成任意语音
文件结构archived_untest_files废弃文件
encoder编码器模型
data_objects
saved_models预训练好的模型
samples样例语音
synthesizer合成器模型
models
saved_models预训练好的模型
utils工具类库
toolbox图形化工具箱
utils工具类库
vocoder声码器模型(目前包含hifi-gan、wavrnn)
hifigan
saved_models预训练好的模型
wavernn
web
api
Web端接口
config
网端配置文件
static前端静态脚本
js
templates前端模板
__init__.py Web端入口文件
:
1, 安装相关环境依赖:
命令:pip安装-r要求. txt
点安装webrtcvad-wheels,
安装pyTorch:从本地开始PyTorch
2.准备预训练模型:可以自己训练模型,也可以下载社区里别人训练的模型。在这里,我们可以先下载别人训练过的模型:
百度链接:https://pan.baidu.com/s/1VHSKIbxXQejtxi2at9IrpA
提货代码:i183
3.将下载的模型放入合成器/saved _ models/mandarin路径。
4.启动Web程序
python.py运行成功后,在浏览器中打开地址。默认值为http://localhost:8080。
5.您也可以使用工具箱启动:
命令:python demo _ toolbox . py-ddatasets _ root
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。