python导入image模块,python怎么安装imageio库
https://www.jinse.com/bitcoin/232358.html写这篇文章,目的是最近在做量化交易,有一个需求是访问比特币链上交易数据,监控大额资金转账,但账户只有一串地址码,无法识别是哪个交易所的,最后在金色财经
找到了一些资料图片,想要将图片转为字符串码,于是有了下文。
PIL全称:python图像库,Python图像处理库。该库支持多种文件格式,并提供强大的图像处理和图形处理功能。
由于PIL只支持Python 2.7,所以枕头库是在PIL的基础上创建的,以支持最新的Python 3.x
1.pip命令安装
pip安装pytesseract
pip安装枕头
2.使用pycharm编辑器安装,如下所示。
安装成功:
安装pytesserac的同时也安装了pillow,所以我们只需要安装pytesserac。
3.试着跑,
源代码如下:
按Ctrl+C复制代码
按Ctrl+C复制代码
出现如下所示的错误,
原因:未安装识别引擎tesseract-ocr。
单击返回目录。
其次,安装识别引擎tesseract-OCR 1。Tesseract是一个开源的ocr引擎。宇宙魔方最初是为英语识别而设计的。在改进引擎和训练系统后,它可以处理其他语言和UTF-8字符。Tesseract 3.0可以处理任何Unicode字符,但它并不是在所有语言中都适用。Tesseract在大字符集语言(比如中文)中速度很慢,但是效果很好。
下载链接:https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw密码:ywc3
因为tesseract-ocr默认不支持中文识别。
将下载的文件:chi_sim.traineddata放入tesserac-OCR安装目录D:\ Program Files(x86)\ Tessera CT-OCR \ Tess data,如图:
2.安装tesseract-ocr后,需要做一些配置。
修改Python安装目录下的pytesseract.py文件(如:D:\ Python 35 \ lib \ site-packages \ pytesserac)。
还可以通过pycharm和Ctrl B快速打开pytesseract源文件:
3.尝试运行,出现以下错误:
pytesserac t . pytesserac t . tesserac t Error:(1,打开数据文件时出错\ \ Program Files(x86)\ \ tesserac t-OCR \ \ chi _ sim . trained data请确保将TESSDATA_PREFIX环境变量设置为您的 TESSDATA 目录。加载语言失败,“chi_sim”宇宙魔方无法加载任何语言!无法初始化宇宙魔方。)
4.解决方法:在TESSDATA_PREFIX环境变量中添加tessdata目录的上级目录路径:(默认为tesseract-ocr安装目录),如下图所示:
注意:配置完环境变量后,您需要重新打开pycharm编辑器(IDE)。运行-编辑配置-
5.再次运行结果:图像识别成功!
但是识别率不是很高,后期优化,不断更新。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。