首页
Python中文网
在线手册
Python入门
Linux教程
Python高级教程
登录
注册
用户名
Email
自动登录
找回密码
密码
登录
立即注册
扫一扫,访问微社区
只需一步,快速开始
论坛
BBS
Python教程
在线手册
Python入门
Linux教程
Python高级教程
Python函数详解
搜索
本版
帖子
用户
道具
勋章
任务
设置
退出
Python论坛 - 国内最好的Python中文社区
»
论坛
›
技术交流
›
python问答 - 求助悬赏区 Help!
›
Python验证码机器学习识别求助
返回列表
查看:
2280
|
回复:
2
[求助]
Python验证码机器学习识别求助
大牛牛
当前离线
积分
7
4
主题
7
帖子
7
积分
贫民
贫民, 积分 7, 距离下一级还需 53 积分
贫民, 积分 7, 距离下一级还需 53 积分
积分
7
发消息
大牛牛
发表于 2020-4-12 23:27:30
|
显示全部楼层
|
阅读模式
最近在学习模拟登录网站,但网站有验证码机制(如下图),利用pytesseract或pytesser很多识别错误,据说用机器学习比较好。但网上找了些文章看,也是一知半解。模仿写过一些测试代码跑了一星期也没跑出模型,有点放弃,特来发帖看看各位大神有没有好的思路或建议提供?
附件100张验证码图片:
https://lanzous.com/ib7rj3c
回复
使用道具
举报
sheeboard
当前离线
积分
956
0
主题
956
帖子
956
积分
圣骑士
圣骑士, 积分 956, 距离下一级还需 44 积分
圣骑士, 积分 956, 距离下一级还需 44 积分
积分
956
发消息
sheeboard
发表于 2020-4-13 16:35:03
|
显示全部楼层
就是监督学习,用jTessBoxEditor多做点样本给tesseract做训练,你把整个验证码库都识别一遍,模型就好了。大量数据加简单算法优于少量数据加复杂算法,谷歌是这么说的。
回复
支持
反对
使用道具
举报
大牛牛
当前离线
积分
7
4
主题
7
帖子
7
积分
贫民
贫民, 积分 7, 距离下一级还需 53 积分
贫民, 积分 7, 距离下一级还需 53 积分
积分
7
发消息
大牛牛
楼主
|
发表于 2020-4-17 15:00:43
|
显示全部楼层
试过,用jTessBoxEditor整理图片库好麻烦,工作量太大了。。
回复
支持
反对
使用道具
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速回复
返回顶部
返回列表