crnn+ctc,

  crnn+ctc,

  场景文本检测和识别实现详细信息(pytorch )1 .环境构建1.1安装基本环境Ubuntu 14.04 cuda opencv 2.4 pytorchlmdbwrap _ ctclmdbapt-getinstalllmdb

  1.2安装pytorchpip、linux、cuda8.0和python2.7:

  点安装3358下载。py torch.org/whl/cu80/torch-0.1.12.post2- cp27-无-Linux _ x86 _ 64。万海

  参考:http://pytorch.org/

  1.3安装wrap _ ctcgitclone https://github。com/百度-research/warp-CTC。gitcdwap-ctcmkdirbuild;cd buildcmake .制作国家政治保卫局。参见OGPU版已添加到环境变量中

  export cuda _ home=/usr/local/cuda cdpytorch _ bindingpythonsetup。py安装参考:

  3359 github.com/seann aren/warp CTC/tree/py torch _ bindings/py torch _ binding

  1.4注意问题中国货代运价指数库文件不足。在使用安装中国货代运价指数安装安装pytorch_binding之前,请确保设置了回家。编译和安装不会报告错误,但调用地面动力装置会导致wrap_ctc中没有地面动力装置属性的错误。 2.场景文本检测和识别预测(

  运行/contrib/crnn/demo.py

  原始图片为:

  识别结果为:

  #加载模型模型路径=。/samples/netcrnn _9_ 112580 .PTH #要标识的图像img_path= ./data/demo.png#要标识的类别分类数nclass=len(字母表)1预约位,LSTM设定隐藏层数nh=128,使用国家政治保卫局。参见国家政治保卫局数ngpu=1model=crnn.crnn (32,1,22,128,1).cuda)

  场景文本检测和识别培训(以第21类英语为例)1.数据预处理

  运行/contrib/crnn/tool/tolmdb.py

  一个本地内存数据库输出路径输出路径=。/train _ lmdb # label imgdata=open( ./train.txt )2 .训练模型,对应于图像

  运行/contrib/crnn/crnn_main.py

  pythoncrnn _ main.py [ - param val ] -训练根培训集路径瓦尔鲁特验证集路径-工作中央处理器工作核心数,默认值=2默认值=256硝石训练轮数、默认值=25 - lr学习率、默认值=0.01-1-cuda使用GPU、actional efault=1 - crnn预训练模型字母表设定分类-双萜-实验模型保存目录-显示间隔设定重复了多少次默认值=500 - n _测试默认值=10值间隔设定了多少次迭代验证,默认值=500 -保存间隔设定了多少次迭代保存模型,默认值=500-500 .action=store_true - adadelta使用阿达德尔塔优化程序,而action= store _ true - keep _ ratio保持图像的长宽比缩放action= store _ true -kee EP _ ratio将保留图像的纵横比action= store _ true 示例:python/contrib/crnn/crnn _ atio

  在修正/contrib/crnn/keys.py中alphabet=ACIMRey万下经口摄取小环癌草血运重增加或减少范畴

  3 .注意事项

  训练和预测采用的班级数和长短期记忆网络隐藏层数应一致

  开源代码库地址:https://github.com/young Miao/crnn

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: