关于ocr的求助

qd_jy · 发表于 2019-2-16 16:37:04

请教高手，怎么样才能做到，识别图片里的文字信息确定图片是否是需要的。比如判断发票是什么发票？

qd_jy · 发表于 2019-2-16 19:08:04

哪位高手给个思路也行！多谢！

sheeboard · 发表于 2019-2-17 11:22:12

谷歌的tesseract或opencv,多收集中文字库做训练。

qd_jy · 发表于 2019-2-17 14:54:34

sheeboard 发表于 2019-2-17 11:22
谷歌的tesseract或opencv,多收集中文字库做训练。

我是初学，听不太懂，还是感谢你的回答。

sheeboard · 发表于 2019-2-17 15:20:12

qd_jy 发表于 2019-2-17 14:54
我是初学，听不太懂，还是感谢你的回答。

tesseract是一个现成的ocr工具，opencv是一个机器视觉库，字符识别一般是把图片灰阶化(去彩色)，取阈值，以阈值为参考二分化图像(像素是1和0，变纯黑白的)，然后调整到指定的大小和现有的字符库比较进行识别。因为软件是老外写的，所以中文识别率不高，所以要多收集中文字库，通过算法（如KNN）来监督学习，来完善识别库以提高识别率。当然你可以只处理几个关键字或发票的字体库，减小库的容量并加快处理速度。相关的学习资料网上很多的，代码也不复杂，慢慢学吧。

		自动登录	找回密码
密码			立即注册

[求助] 关于ocr的求助