找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 428|回复: 4

[求助] 关于ocr的求助

2

主题

6

帖子

6

积分

贫民

积分
6
qd_jy 发表于 2019-2-16 16:37:04 | 显示全部楼层 |阅读模式
请教高手,怎么样才能做到,识别图片里的文字信息确定图片是否是需要的。比如判断发票是什么发票?

回复

使用道具 举报

2

主题

6

帖子

6

积分

贫民

积分
6
qd_jy  楼主| 发表于 2019-2-16 19:08:04 | 显示全部楼层
哪位高手给个思路也行!多谢!
回复 支持 反对

使用道具 举报

0

主题

458

帖子

458

积分

骑士

积分
458
sheeboard 发表于 2019-2-17 11:22:12 | 显示全部楼层
谷歌的tesseract或opencv,多收集中文字库做训练。
回复 支持 反对

使用道具 举报

2

主题

6

帖子

6

积分

贫民

积分
6
qd_jy  楼主| 发表于 2019-2-17 14:54:34 | 显示全部楼层
sheeboard 发表于 2019-2-17 11:22
谷歌的tesseract或opencv,多收集中文字库做训练。

我是初学,听不太懂,还是感谢你的回答。
回复 支持 反对

使用道具 举报

0

主题

458

帖子

458

积分

骑士

积分
458
sheeboard 发表于 2019-2-17 15:20:12 | 显示全部楼层
qd_jy 发表于 2019-2-17 14:54
我是初学,听不太懂,还是感谢你的回答。

tesseract是一个现成的ocr工具,opencv是一个机器视觉库,字符识别一般是把图片灰阶化(去彩色),取阈值,以阈值为参考二分化图像(像素是1和0,变纯黑白的),然后调整到指定的大小和现有的字符库比较进行识别。因为软件是老外写的,所以中文识别率不高,所以要多收集中文字库,通过算法(如KNN)来监督学习,来完善识别库以提高识别率。当然你可以只处理几个关键字或发票的字体库,减小库的容量并加快处理速度。相关的学习资料网上很多的,代码也不复杂,慢慢学吧。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表