python做文字识别,python写翻译软件

  python做文字识别,python写翻译软件

  原标题:Python神工具包!翻译、字符识别、语音转文本都完成了。

  今天给大家介绍一个Python制作的实用工具包,里面包含了很多功能:

  音频转文本

  文本到语音

  屏幕截图OCR文本识别

  复制翻译

  比如截图OCR字符识别等很多实际场景。

  有些pdf是扫描的,不能复印(豆丁网上),有些网页(极客时间)也限制复印功能。这时候抄,太浪费时间了,对吧。通常只能手动输入。当然也可以用一些OCR识别软件,但是因为体积庞大,不方便付费。

  用这个工具很容易解决这个问题。只要打开软件,点击截图,就会自动识别。识别出的文字会自动在对话框中输出,然后直接复制。这非常方便:

  实际效果:

  例如,经常使用汉英翻译。通常的操作是打开百度翻译网页然后复制进去进行翻译,同样不方便。

  用这个工具可以轻松处理,翻译效果还不错:

  动画效果:

  语音识别也是常用的,比如有些人看一些网络课堂视频想做笔记却不想手写打字。可以先把视频中的语音提取出来,然后用这个工具直接转换成文字。

  这些功能都是Python实现的,很强大吧?做起来并不难。可以分两步实现。

  第一步是获取API接口。这些功能都是通过调用百度AI的各种功能API接口获得的,免费使用的次数足够了。

  第二步是使用python的pyqt5 GUI框架创建可视化界面。pyqt5需要学一点,但不难。如果有具体需求的话学习起来也更有针对性。

  下面简单说一下如何获取API接口。

  以语音识别界面为例,进入百度语音识别网站:

  http://ai.baidu.com/tech/speech/asrpro

  选择相应的“文本到语音”和“语音识别”应用,你会得到一串密钥。小心保存它们:API密钥和秘密密钥。

  然后把两串字符复制到这个工具里,点击保存,就可以使用语音转文字功能了。

  其他功能接口获取方法相同。以下是每个函数的URL:

  屏幕截图文本识别:

  http://ai.baidu.com/tech/ocr/general

  文本到语音转换:

  http://ai.baidu.com/tech/speech/tts

  复制翻译:

  http://fanyi-api.baidu.com/api/trans/product/index

  如果你想试试这个工具,但不想得到接口,我给你我自己的。

  最后回复:0726获取这个软件和API接口。

  来源 https://www.52pojie.cn/thread-981080-1-3.html返回搜狐查看更多。

  责任编辑:

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: