ios文字转语音软件,ios微信语音怎么转文字
说到TTS(Text To Speech),虽然不如语音识别普及,但应该算是语音识别技术乃至AI技术的一个实用领域。在生活的很多场景中,我们都会遇到用眼睛看书不方便的情况。无论是在颠簸的公交车上,还是自己开车,无论是晨跑锻炼,还是晚上熄灯睡觉,我们都不方便“读书”。眼花缭乱的老年人或一些视障人士需要机器来帮助他们阅读文本。在这些情况下,用耳朵“听”就成了我们日益增长的需求。移动互联网时代喜马拉雅FM、蜻蜓FM等音频站的出现就是很好的证明。
我们的时代不仅是一个越来越需要“倾听”的时代,也是一个越来越追求个性的时代。每个人都应该听自己想听的。传统电台录制的固定节目显然无法满足个性化需求,更何况一些有特殊需求的人可能需要阅读邮件、文档等内容。以前想听自己喜欢的内容,成本还是比较高的。无论是故事还是新闻,都需要专门的播音员播报,人力成本很高。我们只能在音频平台上找到流行的小说和故事。对于个性化的内容,追求流量的平台还是满足不了我们。
幸运的是,随着语音识别技术的发展,这一切正在改变。或许“听”的时代已经离我们不再遥远。
系统级应用
文本到语音的功能最初是为残疾人服务而开发的。早些年的阅读功能只能阅读简单的文字,比如为用户阅读标题栏菜单和鼠标右键菜单。随着操作系统的更新,系统自带的阅读功能越来越强大。现在无论是Windows系统还是iOS系统,其自带的阅读功能已经可以为我们阅读完整的文章。除此之外,这两个系统和Android系统也有一些可以支持整个系统的语音合成应用。
Windows/iOS:系统自带朗读功能
在Windows S10中,打开开始菜单旁边的搜索按钮,输入“讲述人”或打开控制面板中的“讲述人”功能,让它阅读记事本上的文本。
在讲述人功能界面,系统会读出蓝框圈出的区域。
在“苹果”系统中,朗读的功能被设计得更加通用。如果我们使用的是iPhone,可以通过“设置-通用-辅助功能-语音-阅读屏幕”的方式开启手机的“阅读”功能。
在苹果,我们可以通过“设置-通用-辅助功能-语音-阅读屏幕”找到阅读功能
屏幕上会出现一个“朗读”的浮动窗口。我们可以打开任何我们希望系统朗读的文本,然后单击朗读。窗口周围的按钮可以调节朗读的速度。如果我们不需要系统读取所有内容,我们也可以只选择指定的文本,然后在操作菜单中选择“朗读”,这样系统就只读取选中的部分内容。
朗诵控制面板里可以调节语速,龟兔的标志可以说非常生动。
结合Safari浏览器,可以实现更便捷的阅读管理。Safari可以管理发言列表。我们可以打开多个网页,然后“向发言列表添加内容”。这样我们就可以提前安排好想要听的内容,然后让系统读完一篇文章的内容,继续读下一篇我们选择的文章,就像听歌一样。
将文章添加到阅读列表后,我们可以让safari连续阅读列表页面的内容。
“苹果”系统还会大声读出作为接口提供给第三方的软件调用。比如iOS版本的知乎(只支持老版本)、Evernote等软件都有相关接口。我们可以直接在软件中选择“分享-添加到阅读列表”,将APP中的文字添加到系统的阅读列表中,实现阅读功能。
Android:讯飞语记+懒人听书
相对于“苹果”系统在不同硬件上的通用性,安卓系统在语音阅读上的体验是碎片化的。随着各硬件厂商对Android系统的深度改革,Android手机上并没有统一的语音朗读功能。我们想在这些设备上实现语音阅读,只能依靠第三方app。
目前安卓应用市场上有很多所谓的“语音阅读”app,包括一些同样支持阅读功能的电子书阅读软件。但是,这些应用没有像“苹果”系统那样有现成的语音包可以调用。为了使用他们的阅读功能,他们经常依赖基于第三方的语音包。
我们以《讯飞语录》结合《懒人听书》实现阅读功能为例。其中讯飞笔记主要提供朗读的语音包,懒人则主要提供小说等有版权的文字内容。
首先我们安装两个app,然后打开讯飞笔记。注意不要让系统在后台杀死app进程,否则无法朗读。之后打开懒人听书APP,选择想要听的小说,在小说页面会看到一个耳机图标。点击耳机图标会调用讯飞的文字阅读功能,实现小说阅读。讯飞的阅读控制功能类似于“苹果”。我们可以调整阅读速度和音量。
讯飞的语音阅读控制界面
此外,借助讯飞在语音识别方面的能力,还提供了非常强大的语音输入功能。前面提到的一些语音合成用户,比如司机、视障人士,也是语音输入的刚需,所以这个软件非常适合这些用户。但讯飞免费版对语音输入时间有一定限制,这方面要求高的用户需要购买vip账号。
通过以上例子,我们可以举一反三,灵活组合自己的“读者”。一是准备阅读软件和语音包,二是准备要阅读的内容。由于语音包、小说等文字内容都有自己的版权,语音合成的阅读内容的版权无法界定。现在安卓系统上还没有完善的结合阅读和内容的软件,在安卓上自由“听”还是比较麻烦的。
[!- empirenews.page - ]
微信辅助软件
对于喜欢看微信微信官方账号的朋友来说,语音转换遇到的麻烦并不像安卓系统那么小。很多独立app因为版权问题无法提取微信官方账号的文章,只好求助微信小程序。微信小程序最大的便利就是不用下载app就可以实现各种功能,并且可以为微信微信官方账号文章提供很好的支持。文字转语音功能虽然小,但是也有很多小程序推出了这个功能。这里推荐两个小程序。
飞鸟听听
听鸟是较早开始支持发音阅读的小程序。只要我们在它的首页输入微信官方账号的名称,并将微信官方账号添加到订阅中,小程序就可以为我们阅读微信官方账号中的文章。扩展的功能包括加入收听列表、下载语音文件、分享等。在applet主界面中。我们也可以直接听小程序选的文章,然后关注相关微信官方账号。
在小鸟听,我们可以选择听小鸟推荐的文章,也可以自己输入地址。
如果我们对小程序推荐的微信官方账号不感兴趣,只是想临时用微信官方账号听一篇文章,那么我们只需要把微信官方账号的文章地址复制到小程序的搜索栏,然后点击“开始阅读”,程序就会开始自动识别。除了微信官方账号之外,小程序还支持提取知乎和今日头条,有男声和女声可供选择,可以说是非常周到。
此外,小程序还支持同时将多段内容添加到收听列表中,然后依次播放。但在Android 7.0系统下,该功能无法如小程序教程所述正常使用,会出现重复播放的问题,需要小程序开发者进行优化。
讯飞快读
讯飞度是科大讯飞在微信上推出的一款官方小程序,功能非常强大。此前,微信上有很多使用讯飞语音包的“山寨读书小程序”。讯飞官方小程序上线后,山寨小程序陆续下线。
快读可以实现和小鸟听一样的功能,包括识别微信微信官方账号地址,添加微信官方账号等功能。它和前者最大的区别在于它有多种语音套餐可供选择。我们可以自由选择自己喜欢的播音员声音,调节语速,添加背景音乐。就使用体验而言,讯飞在人声发音优化方面做得很好,包括多音字的处理,日期和年份等。而且识别率还是比较高的。它的整体声音听起来更接近自然人声。问题是讯飞的小程序和它的app是一样的。只有少数语音包是免费使用的,大部分都需要用户购买。
播音员页面有很多种声音可供选择,但大部分都需要付费。
另外,或许是为了保护版权,讯飞的语音阅读过程需要全网联网。如果文章在阅读中途断掉,后面的内容我们就听不下去了,更别说建立阅读清单或者下载语音文件了。这就是讯飞影响用户体验的地方,是官方意图。用户不付费恐怕很难提升体验。
事实上,上述软件或软件厂商大多提供PC端解决方案。由于移动端和PC端在技术上的共性,在性能上并没有太大的区别,这里就不赘述了。此外,我们还可以发现,其实最实用的语音合成技术掌握在少数厂商手中,很多应用并不掌握核心技术。技术合作到期后,他们很可能无法继续服务。如果打算长期使用,最好选择讯飞等几家厂商的软件应用。
总之,文字转语音并不是一项神秘的技术。已经解决了用户“理解”的问题。未来,我们需要解决的是如何让语音更接近真人的阅读,如何让用户听得更舒服。相信随着人工智能的发展,电子合成语音朗读会越来越接近自然语音,甚至在某些领域取代直播。虽然我们仍然无法享受与真人不相上下的语音朗读,但用耳朵听这些合成的声音也是一种灵活的应用,可以为通勤途中的朋友解决燃眉之急。当然,为了用好这些软件和应用,硬件要求也要考虑。
选好外设 收听真切的声音
使用文语转换工具时,当然可以直接通过数码设备或者PC上已经有的各种声音播放设备来播放。但如果要作为一种生活方式,还是加一个适合语音播放的外设比较好。
随着语音合成的应用,你在选择音箱或者耳机的时候要注意一点,就是不能“炫富”。如果没有其他需求,不建议购买目前流行的以多声道表现为设计重点的电竞耳机,或者更注重高低低音效果的中高端音乐耳机,以及多声道扬声器或者中高端音乐扬声器。
在多通道解决方案中,他们中的许多人会通过软件将一些通道的信号拆分到其他通道,以创建一个“伪”多通道。
对于多声道系统,语音一般只使用前置扬声器,其他扬声器不仅浪费,还可能造成干扰。
这样在听音乐、影视作品或玩游戏时会带来更好的体验,但可能会造成混响等妨碍清晰语音播放的情况。在偏向音乐欣赏的耳机和扬声器的设计上,有相当一部分会增加额外的重音来增强感染力,但这样会让中音的声音有些浑浊。
“突出”震撼效果的播放设备通常会自行添加额外的压力效果。
那么,什么样的播放设备更值得考虑呢?首先,音质是卖点,但不强调震撼效果,也不强调支持多少声道,而更倾向于强调音频分离能力、中频表现能力、降低失真的产品。对于喜欢使用耳机的用户,也要考虑长时间佩戴的舒适度。
双音腔耳机设计比较适合语音合成和再现。
另外,对于使用数码产品的用户来说,个人更倾向于使用蓝牙设备,这样会增加更多的使用乐趣。比如他们可以边充电边做家务。他们只要戴上蓝牙耳机或者携带蓝牙音箱,依然可以随时享受“听小说”的乐趣。此外,在餐厅、通勤道路、工作场所等公共场所,使用无线耳机可以更容易地享受语音合成技术带来的乐趣,而不会打扰他人。
常见问题 这样解决
在语音合成的应用中,不可避免地会遇到一些问题,如无法改变说话人和识别合成等。这可能会让刚开始“玩”语音合成的用户感到很困扰。其实很多时候,这些问题都是可以轻松解决的。
更换发言人
由于生活习惯不同,每个人喜欢的语音也不同,所以很多语音合成应用都提供了多种语音选择。一般可以在设置里选择新的音箱,下载音源库。如果未能正常替换,可以先关注下载后是否自动替换。您需要在其他设置页面中选择本机现有的音源合成。其次,由于目前很多应用实际上是一种网络服务,所以较高版本提供的一些功能在较低版本中可以看到,比如添加新的音源,但较低版本可能无法使用这些新的音源。这时候请注意及时更新应用版本。
无法识别合成
首先要确认文件或者应用的兼容性,比如Word文件。不要使用最新版本。如果有条件,最好转换成几乎没有版本差异的TXT纯文本文件。然后,我们需要考虑语音合成软件的完整性,尤其是在PC上使用的时候。由于共享,在调整/卸载语音输入软件等其他软件时,可能会替换或删除一些核心文件。然后可以考虑重装相应的软件,或者根据错误提示下载相应的核心文件,放在相应的位置。
离线无法使用
语音合成和语音识别一样,需要复杂的操作和庞大的数据才能很好的工作,但是有时候因为流量问题或者使用场所的问题,我们不得不断网。这时候除了找到支持离线使用的应用,还可以了解一下应用设置中是否有相应的选项,有些可能有下载数据库或者降低精度等选项。可以根据自己设备的容量和实际需要来选择。
经过简单的了解和配置,日益成熟的语音合成技术已经可以给我们带来很多非常有趣和实用的体验。不管是因为身体原因,还是生活习惯的刚性需求,或者只是喜欢尝试新技术,建议你去尝试。也许你试过之后就离不开它们了。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。