python图像识别技术,基于python的图像识别
首先,我们需要安装PIL和pytesseract库。
PIL:(Python图像库)是Python平台上图像处理的标准库,功能非常强大。
图像识别库。
我这里用的是python3.6。PIL不支持python3,所以我使用下面的命令
安装Pytesseract Pip安装Pillow如果是python2,在命令行执行以下命令:
当我们运行上面的代码时,我们会发现下面的错误:
错误很明显:No such file or directory :"tesseract"。
这是因为我们没有安装tesseract-ocr引擎。
2.tesseract-ocr引擎的光学字符识别(OCR)是指扫描文本数据,然后分析和处理图像文件以获得文本和布局信息的过程。OCR技术非常专业,一般被印刷、印刷行业的从业者使用,可以快速将纸质数据转化为电子数据。中文OCR方面,目前国内水平较高的有清华文同、ajdbd、尚书。他们的产品各有千秋,价格不菲。OCR在国外发展的比较早,比如一些大公司,比如IBM、微软、惠普等。尽管他们没有推出单独的OCR产品,但他们的R&D团队已经掌握了核心技术,并将OCR功能植入了他们自己的软件系统。对于我们程序员来说,一般不需要这么高级的,但是可以在开发中集成基本的OCR功能。这两天搜了很多免费的OCR软件和类库,特意整理了一下。今天先说一下Tesseract,下次再讨论Onenote 2010中的OCR API实现。可以在这里查看OCR技术的简史。
Tesseract的OCR引擎由惠普实验室于1985年首次开发,到1995年,它已经成为OCR行业中三个最准确的识别引擎之一。然而,惠普很快决定放弃OCR业务,Tesseract从此再无踪影。
几年后,惠普意识到,与其搁置宇宙魔方,不如为开源软件行业做点贡献,这样才能焕发魔音——2005年,宇宙魔方被美国内华达信息技术学院获得,并要求谷歌改进、消除bug、优化宇宙魔方。
# # #安装tesseract-ocr引擎
Brew安装宇宙魔方。然后通过tesseract -v V看安装是否成功。
Tesla CT 3 . 05 . 01 Leptonica-1 . 75 . 0 libjpeg 9 b:libpng 1 . 6 . 34:libtiff 4 . 0 . 9:zlib 1 . 2 . 11此时,当我们运行上述代码时,会出现乱码。
这是因为tesseract默认情况下语言包中只有中文包,如下图所示:
# # #安装tesseract-ocr语言包
我们去GitHub下载需要的语言包吧。在这里,我只下载了chi_tra.traineddata和chi_sim.traineddata
github:tesserac-ocr/Tess data
然后放在/usr/local/cellar/tessera CT/3 . 05 . 01/share/Tess data路径下。
您可以通过tessera CT-list-languages查看本地语言包:
您可以通过tessera CT-help-psm查看PSM。
0:定向脚本监控(OSD)
1:使用OSD进行自动分页
2:自动分页,但不使用OSD或OCR(光学字符识别)
3:全自动分页,但不使用OSD(默认)
4:假设一个可变大小的文本列。
5:假设单个统一的文本块是垂直对齐的。
6:假设一个统一的文本块。
7:将图像视为单行文本。
8:将图像视为一个单词。
9:把一个图像想象成一个圆圈里的一个单词。
0:将图像视为单个字符。
为什么在这里强调语言包和psm,因为我们在使用中会用到,
例如,组合了多个语言包并被视为统一的文本块将使用以下参数:
pytesserac t . image _ to _ string(image,lang=chi_sim eng ,config=-psm 6 )
在这里,我们组合并使用多种语言包。
接下来,我们来看看配置一切的正确结果。
从pilimport image image=image.open(./pic/c . png )code=pytesserac . image _ to _ string(image,lang= chi _ sim ,config=-psm6) print (code)现在成功了。
号外福利号外程序员的福音:“老曾筋骨曲痛贴”,百年祖传配方,专治腰椎间盘、肩周、颈椎、坐骨神经、腰腿痛等。博主亲测效果很好。因为长期久坐写代码,坐姿不规范,导致脖子疼,腰疼。用了之后疼痛逐渐缓解,现在有那么轻松了。用了之后就可以全身写代码了。
扫码下方二维码,关注公众号“伟大程序猿的诞生“,回复“膏药”领取优惠券,进行购买扫码关注公众号“伟大程序猿的诞生“,更多干货新鲜文章等着你公众号回复“资料获取”,获取更多干货哦
有问题添加本人微信号“fenghuokeji996” 或扫描博客导航栏本人二维码
我的博客即将同步到腾讯云社区,邀请大家一起入驻:
https://cloud.tencent.com/developer/support-plan?invite_code=ncnq0hloo5yw
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。