基于python的文字识别系统,python 语言识别
本文主要和大家分享如何调用百度的接口实现图片的字符识别。整体上是用Python实现的。需要使用的第三方库包括aip、PIL、keyboard和pyinstaller。有需要可以参考一下。
00-1010 1.环境和配置要求百度界面2。具体实现步骤获取截图调用百度aip识别打印文字调用打包程序生成专用识别文字小程序。今天给大家分享的主题是用百度界面实现图片的文字识别。
目录
整体上是用Python实现的。需要使用的第三方库包括aip、PIL、keyboard和pyinstaller。如果没有安装,可以使用pip install Baidu-AIP/pillow/keyboard/py installer指令安装在CMD中。
1.环境和配置要求
打开网站,如果没有注册,请先注册,然后登录点击管理控制台,点击左边的产品服务人工智能文字识别,点击创建应用,输入应用名称如Baidu_OCR,选择应用如学习办公,最后做一个简单的应用描述,然后点击立即创建.应用列表会出现,包括AppID、API Key、Secret Key,等信息,后面会用到。
百度接口
整个程序的大致思路是,用截图软件截图后,交给百度界面识别,返回结果。当然也可以是局部图像识别。我用的是QQ自带的截图软件,快捷键CTRL ALT A用来打开截图。选中截取的区域后,回车保存到粘贴板上,也可以使用其他截图软件。
2.具体实现步骤
keyboard类库是用来监控键盘动作的,所以当一个快捷键被按下时,会有相应的动作。PIL的ImageGrab用于获取剪贴板中的图片并生成本地图片文件。
#1.屏幕上显示程序运行的图片
keyboard.wait(ctrl alt a )
打印(“开始截图”)
keyboard.wait(“回车”)
打印(“保存屏幕截图”)
时间.睡眠(0.1)
#2.保存图片
image=ImageGrab.grabclipboard()
image.save(img.png )
获取截图
首先用注册时生成的应用程序的AppID、API Key和Secret Key初始化应用程序,然后读取保存的图片,打印识别的字符。
withopen(img.png , rb)asfp:
image=fp.read()
text _ list=client . basic accurate(image)[ words _ result ]
fortextintext_list:
打印(文本[单词])
运行结果如图所示:
我们还可以添加一个无限循环,这样就可以随时截图了。
调用Baidu aip识别并打印文字
pyinstaller库用于打包小程序并生成。exe文件,以便可以随时识别字符。在命令行用pyinstaller xxx.py打包生成的exe文件,最后在生成的dist文件夹中找到xxx.exe文件,如下图:
最后附上完整的源代码:
#引入截图软件,把文件拿到本地端,识别图片文字,最后打包。
Importkeyboard#控制键盘
Frompimportimagegrab #保存图片
进口时间
fromaipimportAipOcr
你的APPIDAKSK
APP_ID=17076767
API _ KEY= af 3 rj 5 halm z5 an 8 prsgwth 4m
SECRET_KEY=***************
client=AipOcr(应用标识,应用密钥,保密密钥)
i=0
whileTrue:
#1.屏幕上显示程序运行的图片
keyboard.wait(ctrl alt a )
打印(“开始截图”)
keyboard.wait(“回车”)
打印(“保存屏幕截图”)
时间.睡眠(0.1)
#2.保存图片
image=ImageGrab.grabclipboard()
image.save(img{}。巴布亚新几内亚。格式(一))
调用通用字符识别(高精度版本)
withopen(img{}。巴布亚新几内亚。格式(I), rb)asfp:
image=fp.read()
text _ list=client . basic accurate(image)[ words _ result ]
fortextintext_list:
打印(文本[单词])
i=1
图片识别案例
关于用十行Python代码实现字符识别功能的文章到此为止。有关Python字符识别的更多信息,请搜索热门IT软件开发工作室之前的文章或继续浏览下面的相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。