ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 蓝天630902

[分享] 验证码识别讲座

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-22 05:08 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖已被收录到知识树中,索引项:图像处理和GDI
本帖最后由 蓝天630902 于 2012-7-22 06:44 编辑
liucqa 发表于 2012-7-21 13:55
一般验证码处理的步骤是:
去边框--反转--转灰度--二值化--OCR


首先,让我上传《text-based-captcha-strengths-and-weaknesses.pdf》里面的一个图片,来看看效果:


text-based-captcha-strengths-and-weaknesses.jpg
text-based-captcha-strengths-and-weaknesses1.jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-22 05:50 | 显示全部楼层
本帖最后由 蓝天630902 于 2012-7-22 06:47 编辑

现在,我们对上面的  “quxg4h”   图片进行处理(包括2次去噪),看看效果如何:

验证码识别7.rar

35.33 KB, 下载次数: 296

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-22 06:57 | 显示全部楼层
对于“cg4a9"图片,不需要额外的降噪,只需要扶扶正,就可以了:

验证码识别8.rar

30.33 KB, 下载次数: 280

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-22 07:03 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
lzqlaj 发表于 2012-7-21 21:08
很是高深,不太明白。http://myw.1tpan.com/#/tpan这个网站的验证码可以识别吗?

这个不能,
http://www.1tpan.com/tpan/site/diskweb/servlet/kaptcha.png
里面的图片,现在想不出分离的办法

TA的精华主题

TA的得分主题

发表于 2012-7-22 09:01 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2012-7-22 09:25 | 显示全部楼层
本帖最后由 引子玄 于 2012-7-22 09:49 编辑

下一个讲座,如果蓝天大师,能就一些实用、常用的处理技巧,开点讲座,是很所大家盼望的。
比如:
如何让空白网页不导入EXCEL?(免使空白页导入挤占SHEET空间)
如何用VBA自动保存当前网页源文件,然后自动导入EXCEL?(免去菜鸟找URL的苦恼,好让菜鸟不找URL也能搞定网抓)


如何让空白网页不导入EXCEL的案例有现成的(http://support.ufida.com.cn/kbm/kbmedit3.asp?iKbmID=1

http://support.ufida.com.cn/kbm/kbmedit3.asp?iKbmID=600
缩小了点URL范围,便于练习操作。







TA的精华主题

TA的得分主题

发表于 2012-7-22 10:22 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-22 10:50 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
引子玄 发表于 2012-7-22 09:25
下一个讲座,如果蓝天大师,能就一些实用、常用的处理技巧,开点讲座,是很所大家盼望的。
比如:
如何让 ...

Sub test()
    Dim temp, s
    Dim arr
    Cells.RowHeight = 13.5
    With CreateObject("Microsoft.XMLHTTP")
        For p = 1 To 600
            .Open "GET", "http://support.ufida.com.cn/kbm/kbmedit3.asp?iKbmID=" & p, False
            .Send
            n = Range("a65536").End(xlUp).Row
            temp = StrConv(.responseBody, vbUnicode, &H804)
            If Split(Split(temp, "</font>")(1), ">")(0) <> "错误 '80020009'" Then '这一句应该可以过滤
            temp = Split(temp, "</td>")
            For i = 1 To UBound(temp) - 1 Step 2
                s = Split(temp(i), ">")
                Cells(n + 1, (i + 1) / 2) = Replace(s(UBound(s)), " ", "")
            Next i
            End If
        Next p
    End With
End Sub

TA的精华主题

TA的得分主题

发表于 2012-7-22 13:16 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

本帖最后由 引子玄 于 2012-7-22 13:18 编辑

以前你用IE对象法过滤了空白网页,现在用XMLHTTP对象也过滤了空白网页,那我以后,学着也用QueryTables对象法,过滤空白网页。

TA的精华主题

TA的得分主题

发表于 2012-7-24 20:58 | 显示全部楼层
lzqlaj 发表于 2012-7-22 09:01
期待大师能解决。。

http://club.excelhome.net/thread-897117-1-1.html
学习一下,你自己试试吧。我估计识别率可能在50%作用。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-30 20:43 , Processed in 0.047528 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表