ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wcymiss

[原创] 不懂html也来学网抓(xmlhttp/winhttp+fiddler)

    [复制链接]

TA的精华主题

TA的得分主题

发表于 2014-12-2 14:04 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖已被收录到知识树中,索引项:网页交互
5555,小白鼠要慢慢看了唉

TA的精华主题

TA的得分主题

发表于 2014-12-2 15:43 | 显示全部楼层
wcymiss 发表于 2014-12-1 15:59
不过这个网站用POST的话速度快。因为它的responsetext的字节少。

吴老师,我把赶集网的登陆附件又更新了一下,现在就算我清历史记录把excel重启,执行代码,提示验证成功,您有空再帮我看看是不是真登陆上去了,就是觉得太简单了点,所以不敢断定是否真成功了

点评

hash值是动态的。你最后判断验证的那句代码写错了。还有,为了不受浏览器等的干扰,登录还是用winhttp对象比较好。  发表于 2014-12-2 17:02

TA的精华主题

TA的得分主题

发表于 2014-12-2 17:57 | 显示全部楼层
本帖最后由 renahu 于 2014-12-3 07:53 编辑
wcymiss 发表于 2014-12-1 15:59
不过这个网站用POST的话速度快。因为它的responsetext的字节少。

吴老师,是这句吗?
        If InStr(strText, "renahu") = 0 Then MsgBox "验证失败!" Else MsgBox "有我的名字!验证成功!"

错在哪里呀?是代码写错了吗?

吴老师,我按您说的把赶集网登陆改了,您再帮我看看:
登陆练习2.rar (28.47 KB, 下载次数: 17)

TA的精华主题

TA的得分主题

发表于 2014-12-3 08:46 | 显示全部楼层
本帖最后由 renahu 于 2014-12-3 08:48 编辑
wcymiss 发表于 2014-12-1 15:59
不过这个网站用POST的话速度快。因为它的responsetext的字节少。

吴老师几个登陆练习就差网易登陆没有成功了,还是想问一问网易登陆的问题:

这是我在fiddler中寻找登陆session,左面这个session很像例题中的登陆session,网址类似,也有登陆成功字样
但图标不一样,而且也不是post,是get。

关键是参数里面找不到密码这项。

再看这个session,看网址有点像

参数和老师例题中的不一样,这个 rcode 是不是经过加密处理的密码呢?

搜索  rcode ,其他地方都没有,只有这个js文件中有一个,看不明白怎么加密的

在这里看得更清楚点
吴老师,您看看,到底哪个是登陆session?例题中的登陆session实在是找不到了

点评

你为什么会有reg.163.com?  发表于 2014-12-3 15:33

TA的精华主题

TA的得分主题

发表于 2014-12-3 08:57 | 显示全部楼层
受教了 很实用的技巧 好东西谢谢!

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-12-3 09:27 | 显示全部楼层
renahu 发表于 2014-12-3 08:46
吴老师几个登陆练习就差网易登陆没有成功了,还是想问一问网易登陆的问题:

这是我在fiddler中寻找登陆 ...

我上传我的163邮箱登录的session包和赶集网登录的代码,你自己对照吧。

一定要在纯净的环境下抓包。


163邮箱登录saz.rar

98.1 KB, 下载次数: 166

赶集网登录.rar

8.37 KB, 下载次数: 132

TA的精华主题

TA的得分主题

发表于 2014-12-3 12:50 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 renahu 于 2014-12-3 12:52 编辑
wcymiss 发表于 2014-12-3 09:27
我上传我的163邮箱登录的session包和赶集网登录的代码,你自己对照吧。

一定要在纯净的环境下抓包。


谢谢老师,我的环境已经够纯净了,也许是系统环境等别的因素吧,实在看不到老师的登陆session,只好作罢。赶集网的问题,看来是set-cookie的数量,我发现XMLHTTP有7个,WinHttp有8个,所以老师写了一个大于等于7,更严谨一些。老师课上的这几个例子中搜房网和58确实很锻炼人,虽然不是很懂,但长见识,老师登陆的网址肯定不少,能不能再推荐几个类似的比较复杂的登陆让我们练一练。我就怕那些参数找不到的,只要能找到参数还是可以模仿老师的方法抓一抓。

TA的精华主题

TA的得分主题

发表于 2014-12-3 13:35 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 zongyj 于 2014-12-3 13:37 编辑

英超数据,请问老师正则中(.*?)a+........(.*?)a+怎么简化
  1. Sub yc()
  2.     Dim htm1 As New XMLHTTP
  3.     Dim str As String, ar
  4.     Dim reg As New RegExp
  5.     Dim arr
  6.     Dim i, j, m, n
  7.     Sheet4.Cells(4, 1).Resize(65533, 20).ClearContents
  8.     With htm1
  9.         .Open "POST", "http://cn.zso8.com/odds/search/", False
  10.         .setRequestHeader "Content-Type", "application/x-www-form-urlencoded"
  11.         .setRequestHeader "Referer", "http://cn.zso8.com/odds/search/"
  12.         .send "type=2&CompanyID=11%7C%E6%BE%B3%E9%97%A8&leagueID=36&teamID=0&kind=1&port=&odds1=&do0=%E7%A1%AE%E5%AE%9A"
  13.         str = .responseText
  14.         Debug.Print str
  15.     End With
  16.     With reg
  17.         .Global = True
  18.         .MultiLine = True
  19.         .Pattern = "\s"
  20.         str = .Replace(str, "")
  21.         .Pattern = ".*?(<trid.*)"
  22.         str = .Replace(str, "$1")
  23.         .Pattern = "&nbsp;"
  24.         str = .Replace(str, "")
  25.         .Pattern = "<tr.*?>"
  26.         str = .Replace(str, "y")
  27.         .Pattern = "<.*?>"
  28.         str = .Replace(str, "a")
  29.         Debug.Print str
  30.         .Pattern = "ya+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+(.*?)a+"
  31.         Set ar = .Execute(str)
  32.         ReDim arr(0 To ar.Count, 19)
  33.         For i = 0 To ar.Count - 1
  34.             For j = 0 To 19
  35.                 arr(i, j) = ar.Item(i).SubMatches(j)
  36.             Next
  37.         Next
  38.         n = Sheet4.Range("a65533").End(xlUp).Row
  39.         Sheet4.Cells(n + 1, 1).Resize(ar.Count - 1, 20) = arr
  40.     End With
  41. End Sub
复制代码

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-12-3 15:31 | 显示全部楼层
zongyj 发表于 2014-12-3 13:35
英超数据,请问老师正则中(.*?)a+........(.*?)a+怎么简化

你想得到n个Submatches就只能n个()了。

ya+(?:(.*?)a+)+ 这样的只能得到1个submatches

或者你用两个正则对象。或者改用split等其他方式。

假如你只是需要书写上的简化的话,可以replace(sring(20,"*"),"*","(.*?)a+"))

评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2014-12-3 17:49 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
renahu 发表于 2014-12-3 08:46
吴老师几个登陆练习就差网易登陆没有成功了,还是想问一问网易登陆的问题:

这是我在fiddler中寻找登陆 ...

登陆 http://mail.163.com/
这个就有的
顺便说一下,我的系统是win7-64, 2010,IE11
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-16 11:34 , Processed in 0.051046 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表