ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: liucqa

[原创] 网页采集(网页抓取)教程第二课-用WinHTTP提交Post,viewstate获取和URLEncode编码方法

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2013-7-24 19:12 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互
楼主你好厉害 膜拜

TA的精华主题

TA的得分主题

发表于 2013-8-30 13:38 | 显示全部楼层
本帖最后由 wx486 于 2013-8-30 14:40 编辑
kangatang 发表于 2012-7-18 14:29
大师为介绍相关知识,讲得比较全面。但针对1楼的问题我给出另外一种解决思路(XMLHTTP + QURYTABLE)

受kangatang兄的启发,用了类似方法也测试成功了,没有用到解码等麻烦也不易学的代码,直接把HTTPFOX抓到POST数据粘贴生成一个文本文件(附件中的posttxt.txt),是不是可以这样理解:http://club.excelhome.net/thread-1049013-1-1.html里的第3问的答案是肯定的?。谢谢liucqa大师的教程(受益良多),谢谢kangatang兄的代码。我的代码运行稍慢,但另一个同类问题用的也是类似这个方法却很快(http://club.excelhome.net/forum. ... 5&page=1#pid7164470),速度相差这么大,不知何因?另:kangatang兄的代码在我的WIN8+OFFICE2013中运行不出错却没有取到数据。
我的代码如下:
附件: 学习网抓(懒人法).zip (46.36 KB, 下载次数: 96)
  1. Sub xml()
  2.     Dim doc As Object, i%, j%, p%, k%, s$, s1$, s2$, r
  3.     Set doc = CreateObject("htmlfile")
  4.     [a1].CurrentRegion.ClearContents
  5.     t = Timer
  6.     Application.ScreenUpdating = False
  7.     Open ThisWorkbook.Path & "\posttxt.txt" For Input As #1
  8.     postdata = VBA.StrConv(InputB(LOF(1), 1), 64)
  9.     s1 = Split(postdata, "wx486")(0)
  10.     s2 = Split(postdata, "wx486")(1)
  11.     With CreateObject("msxml2.xmlhttp")
  12.         For p = 1 To 20
  13.             DoEvents: Application.StatusBar = "正在获取第" & p & "页数据,累计用时" & Format(Timer - t, "0.0秒")
  14.             postdata = s1 & p & s2
  15.             .Open "post", "http://www.gzgcjg.com/gzqypjtx/Estimate/ZY/MainQueryMarkZY.aspx", True
  16.             .setRequestHeader "content-type", "application/x-www-form-urlencoded"
  17.             .send (postdata)
  18.             Do Until .readystate = 4
  19.                 DoEvents
  20.             Loop
  21.             s = .responsetext
  22. '            With CreateObject("new:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}")
  23. '                .SetText s
  24. '                .PutInClipboard
  25. '            End With
  26.             doc.body.innerhtml = s
  27.             For i = 0 To doc.all.tags("table").Length - 1
  28.                 If InStr(doc.all.tags("table")(i).innertext, "排名") Then
  29.                     Set r = doc.all.tags("table")(i).Rows
  30.                 End If
  31.             Next
  32.             For i = IIf(p = 1, 0, 1) To r.Length - 1
  33.                 k = k + 1
  34.                 For j = 0 To r(i).Cells.Length - 1
  35.                     Cells(k, j + 1) = r(i).Cells(j).innertext
  36.                 Next
  37.             Next
  38.         Next
  39.     End With
  40.     Close #1
  41.     Application.ScreenUpdating = True
  42.     MsgBox "OK,共用时" & Format(Timer - t, "0.0秒")
  43. End Sub
复制代码

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2013-8-30 13:55 | 显示全部楼层
赵莲 发表于 2012-12-12 23:47
请老大写一个实例

VBA 操作网页 比如 本版 搜索 网页 怎么提取 得到的搜索结果的链接

这个需要你自己写代码,liucqa大师说过:只指路,不登山。{:soso_e113:}

TA的精华主题

TA的得分主题

发表于 2013-9-15 14:24 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
感谢老师的教导

TA的精华主题

TA的得分主题

发表于 2013-9-19 09:22 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
找了好久了,先收藏再学习

TA的精华主题

TA的得分主题

发表于 2013-9-20 07:22 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
每次回帖、谢谢!

TA的精华主题

TA的得分主题

发表于 2013-9-22 16:07 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
还是摸不着头脑

TA的精华主题

TA的得分主题

发表于 2013-11-16 17:01 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
学习一下,很好了

TA的精华主题

TA的得分主题

发表于 2013-12-9 12:56 | 显示全部楼层
请教一下,我找到了是GB2312的转码,用转码公式转换过来了,用一个变量t代替提交时就不能出现结果。我把要post的东西指向单元格也不行了,不知怎么回事,望指教,谢谢!

TA的精华主题

TA的得分主题

发表于 2013-12-16 19:42 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-22 18:21 , Processed in 0.044187 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表