(图片来源网络,侵删)
tesseract是google维护的一个图片文字识别ocr项目,项目网址是https://github.com/tesseract-ocr/tesseracttesseract的官方文档网址是https://tesseract-ocr.github.io/源码编译安装有点复杂,可以使用yum安装yum安装提示无tesseract软件,安装 EPEL 软件源的发布包yum install epel-release安装tesseract软件yum install tesseract查看版本tesseract -v查看支持的语言tesseract --list-langs下载tesseract中文语言包到tesseract的最佳训练模型项目“https://github.com/tesseract-ocr/tessdata_best”找“chi_sim.traineddata”和“chi_sim_vert.traineddata”将其上传到“/usr/share/tesseract/tessdata”目录下使用方法,参考官网文档 “https://tesseract-ocr.github.io/tessdoc/Command-Line-Usage.html”tesseract 4.png - -l chi_sim+eng-l执行使用中文和英文使用quiet不显示软件信息tesseract 4.png - -l chi_sim+eng quiet
0 评论