找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 2280|回复: 2

[求助] Python验证码机器学习识别求助

4

主题

7

帖子

7

积分

贫民

积分
7
大牛牛 发表于 2020-4-12 23:27:30 | 显示全部楼层 |阅读模式
最近在学习模拟登录网站,但网站有验证码机制(如下图),利用pytesseract或pytesser很多识别错误,据说用机器学习比较好。但网上找了些文章看,也是一知半解。模仿写过一些测试代码跑了一星期也没跑出模型,有点放弃,特来发帖看看各位大神有没有好的思路或建议提供?







附件100张验证码图片:https://lanzous.com/ib7rj3c
回复

使用道具 举报

0

主题

956

帖子

956

积分

圣骑士

积分
956
sheeboard 发表于 2020-4-13 16:35:03 | 显示全部楼层
就是监督学习,用jTessBoxEditor多做点样本给tesseract做训练,你把整个验证码库都识别一遍,模型就好了。大量数据加简单算法优于少量数据加复杂算法,谷歌是这么说的。
回复 支持 反对

使用道具 举报

4

主题

7

帖子

7

积分

贫民

积分
7
大牛牛  楼主| 发表于 2020-4-17 15:00:43 | 显示全部楼层
试过,用jTessBoxEditor整理图片库好麻烦,工作量太大了。。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表