ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wcymiss

[原创] 不懂html也来学网抓(xmlhttp/winhttp+fiddler)

    [复制链接]

TA的精华主题

TA的得分主题

发表于 2014-12-12 12:02 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互
农业银行日元汇率
  1. Option Explicit

  2. Sub hk()
  3.     Dim xml As New WinHttpRequest, str As String, reg As New RegExp, xml1 As String, html
  4.     Dim i, j, m, n
  5.     Dim ar, arr
  6.     Dim VIEWSTATE As String, EVENTTARGET As String, EVENTARGUMENT, EVENTVALIDATION, ddr As String, date1, date2
  7.     Dim tb
  8.     xml1 = "http://app.abchina.com/rateinfo/RateHistorySearch.aspx"
  9.     With xml
  10.         .Open "GET", xml1, False
  11.         .Send
  12.         str = .ResponseText
  13.         With reg
  14.             .Global = True
  15.             .MultiLine = True
  16.             .Pattern = "\s"
  17.             str = .Replace(str, "")
  18.             .Pattern = "VIEWSTATE""value=""(.*?)"""
  19.             VIEWSTATE = .Execute(str).Item(0).SubMatches(0)
  20.             .Pattern = "DATION""value=""(.*?)"""
  21.             Set ar = .Execute(str)
  22.             EVENTTARGET = .Execute(str).Item(0).SubMatches(0)
  23.         End With
  24.         ddr = Sheet4.Range("a1")
  25.         date1 = Sheet4.Range("b1")
  26.         date2 = Sheet4.Range("c1")
  27.         Set html = CreateObject("htmlfile")
  28.         .Open "GET", xml1, False
  29.         .Send "_VIEWSTATE=" & VIEWSTATE & "&_EVENTTARGET" & EVENTTARGET & "&ddr1=" & encodeURI(ddr) & "&datepicker1=" & date1 & "&datepicker2=" & date2 & "&btnSearch=" & encodeURI("搜索")
  30.         str = .ResponseText
  31.         Debug.Print str
  32.         html.body.innerhtml = .ResponseText
  33.         Set tb = html.all.tags("table")(1).Rows
  34.         For i = 0 To tb.Length - 1
  35.             For j = 1 To tb(i).Cells.Length - 1
  36.                 Sheet4.Cells(i + 3, j) = tb(i).Cells(j).innertext
  37.             Next
  38.         Next
  39.     End With
  40. End Sub
  41. Function encodeURI(strTobecoded As String) As String
  42.     With CreateObject("msscriptcontrol.scriptcontrol")
  43.         .Language = "JavaScript"
  44.         encodeURI = .Eval("encodeURIComponent('" & strTobecoded & "');")
  45.         'encodeURIComponent无法转换括号,所以再替换下括号
  46.         encodeURI = Replace(Replace(encodeURI, "(", "%28"), ")", "%29")
  47.     End With
  48. End Function
复制代码

TA的精华主题

TA的得分主题

发表于 2014-12-12 17:30 | 显示全部楼层
renahu 发表于 2014-12-3 12:50
谢谢老师,我的环境已经够纯净了,也许是系统环境等别的因素吧,实在看不到老师的登陆session,只好作罢 ...

这个fiddler2.xx好像session里获取不到https,改成fiddler4就可以了

TA的精华主题

TA的得分主题

发表于 2014-12-12 22:45 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2014-12-16 15:14 | 显示全部楼层
绝对赞,瞄了瞄,有空细看

TA的精华主题

TA的得分主题

发表于 2014-12-19 11:18 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
@wcymiss你好
每次都要通过fiddler得到有数据的url,然后才能用代码抓取url的数据
我想知道,可以不用fiddler吗,直接用代码获得有数据的url,然后在抓取,可行吗?怎么实现呢?

点评

我不会。  发表于 2014-12-19 11:34

TA的精华主题

TA的得分主题

发表于 2014-12-22 17:17 | 显示全部楼层
@ wcymiss 你好,我能不能看看你的帖子:”WINSOCK API类 简单实例演示(分别应用于http协议和smtp协议 ......."
提示我权限高于50才能阅览。

点评

你看不懂的,别看了~ 你还是从基本的开始学吧~  发表于 2014-12-22 17:53

TA的精华主题

TA的得分主题

发表于 2014-12-23 06:09 | 显示全部楼层
本帖最后由 zss427607 于 2014-12-23 19:59 编辑
wcymiss 发表于 2014-10-22 16:56
再上一个动态参数的例子:

网站:http://www.abchina.com/cn/Public ... t20101217_45743.htm


吴姐,按照动态参数的例子。尝试登陆内部网站失败,能否指定一下呀。

复件 169.zip

1.42 MB, 下载次数: 4

TA的精华主题

TA的得分主题

发表于 2014-12-23 07:58 | 显示全部楼层
活宝番茄蛋花汤 发表于 2014-12-19 11:18
@wcymiss你好
每次都要通过fiddler得到有数据的url,然后才能用代码抓取url的数据
我想知道,可以不用fi ...

url都不给出,相当于不知道要什么

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-12-23 12:19 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
zss427607 发表于 2014-12-23 06:09
吴姐,按照动态参数的例子。尝试登陆我厂的内部网站失败,能否指定一下呀。

这个应该不难啊。准确发送__VIEWSTATE和__EVENTVALIDATION应该就可以啊(每次请求都要发送从上一次的responsetext里获取的这两个参数的值)。注意url的转码。你代码怎么写的?

TA的精华主题

TA的得分主题

发表于 2014-12-23 19:59 | 显示全部楼层
是不是立即窗口出现的东西才可以用处理字符得到立即窗口里的数据

点评

没听懂。你能不能加上标点符号?  发表于 2014-12-24 09:19
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-7-3 11:13 , Processed in 0.047135 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表