ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wcymiss

[原创] 不懂html也来学网抓(xmlhttp/winhttp+fiddler)

    [复制链接]

TA的精华主题

TA的得分主题

发表于 2015-10-24 21:45 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖已被收录到知识树中,索引项:网页交互
本帖最后由 jpj123 于 2015-10-24 21:46 编辑


最近学习网抓,借鉴各位老师的代码写获取1-8页的!
  1. Sub HomerWork1_3()
  2. '新手:jpj123
  3. '作业:1、网站:http://data.bank.hexun.com/lccp/jrxp.aspx
  4. '      操作:点击“今日在售产品”,获取今日在售产品第1-8页的数据。

  5.     Dim xml, url As String, St As String
  6.     Dim arr, brr, ar, i%, r%, html, Db, tr, td, n%, L%, j%, a%
  7.     ActiveSheet.Cells.Clear
  8.     For L = 1 To 8
  9.     url = "http://data.bank.hexun.com/lccp/Jrxp.aspx?col=1&tag=desc&date=2014-10-21&page=" & L
  10.     Set xml = CreateObject("MSXML2.XMLHTTP")
  11.     Set html = CreateObject("htmlfile")
  12.     With xml
  13.         .Open "GET", url, False
  14.         .send
  15.         St = .responseText
  16.     End With
  17.     St = Split(Split(St, "<div class=""mark"">")(1), "</div>")(0)
  18.     html.body.innerhtml = St
  19. Set Db = html.all.tags("table")
  20. n = ActiveSheet.UsedRange.Rows.Count
  21. If L = 1 Then a = 0: n = n - 1 Else a = 1
  22.      For i = a To Db(0).Rows.Length - 1
  23.         Set tr = Db(0).Rows(i)
  24.         n = n + 1: j = 0
  25.         For Each td In tr.Cells
  26.             j = j + 1
  27.             If j >= 2 Then ActiveSheet.Cells(n, j - 1) = td.innertext
  28.         Next
  29.     Next
  30. Next
  31. MsgBox "成功获取网页数据!"
  32. End Sub
复制代码

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2015-10-31 21:52 | 显示全部楼层
好强大的赶脚,我使用了一个网页但是数据提取不成功。就是在替换那里有问题

TA的精华主题

TA的得分主题

发表于 2015-10-31 21:55 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
测试了,出现错误。

TA的精华主题

TA的得分主题

发表于 2015-11-2 22:43 来自手机 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
感谢,现在回过头来看 很多东西都变得明了了

TA的精华主题

TA的得分主题

发表于 2015-11-4 07:14 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2015-11-5 09:48 | 显示全部楼层
QQ图片20151105094411.png
网站有这样的认证框怎么模拟登陆?fiddle抓不到。

TA的精华主题

TA的得分主题

发表于 2015-11-5 11:16 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
wcymiss 发表于 2014-10-21 21:55
获取数据-防盗链的处理-模拟Cookie:

再次提醒,抓包前请先清除浏览器所有Cookie、缓存、历史数据。

QQ图片20151105111216.png
吴姐,我怎么老是抓不到302 这个网页呢?也就是说找不到“Cookie”值的发源地。谢谢空了指点一下!

TA的精华主题

TA的得分主题

发表于 2015-11-5 18:18 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2015-11-11 16:05 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
VBA万岁 发表于 2014-10-22 12:33
ie法完成作业1:
Sub 今日在售银行产品()
'On Error Resume Next

.Document.all.tags("a")(181).Click  大神,你的这个翻页效果没反应呀,该怎么翻页呀

TA的精华主题

TA的得分主题

发表于 2015-11-13 16:00 | 显示全部楼层
amour0861 发表于 2015-3-5 16:51
感谢大神回复,修改API神马的太吓人了……我最后找到的办法是换C#。

关键代码:

我也遇到同样的问题,换c#该咋写啊
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-16 00:31 , Processed in 1.053780 second(s), 19 queries , Gzip On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表