ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 2029|回复: 9

[求助] 自动获取网页数据

[复制链接]

TA的精华主题

TA的得分主题

发表于 2015-1-26 14:36 | 显示全部楼层 |阅读模式
问题描述:
大家好,我想找一个网页抓取网页数据的程序,论坛上有对应的,不过总是改不对。我懂得基本的vba,不过对网页数据获取就不懂了。
需要获取数据的网页共有500多页,不能一个个复制,只能通过vba批量获取。获取结果如附件左边表。谢谢。 网页抓取数据.zip (9.13 KB, 下载次数: 116)



网页地址:http://usa.postcodebase.com/zh-hans/all


TA的精华主题

TA的得分主题

发表于 2015-1-26 17:17 | 显示全部楼层
本帖最后由 浮华、缠绕指尖 于 2015-1-26 23:21 编辑

try it if help you
  1. Sub test()
  2. Dim p, i, j, html, tb, m
  3.     Set html = CreateObject("htmlfile")
  4.     With CreateObject("winhttp.winhttprequest.5.1")
  5.         For p = 0 To 502
  6.             DoEvents
  7.             .Open "GET", "http://usa.postcodebase.com/zh-hans/all?page=" & p, False
  8.             .send
  9.             html.body.innerhtml = .responsetext
  10.             Set tb = html.getElementsByTagName("tr")
  11.             For i = IIf(p = 0, 0, 1) To tb.Length - 1
  12.                 m = m + 1
  13.                 For j = 0 To tb(i).Cells.Length - 1
  14.                     Cells(m, j + 1) = tb(i).Cells(j).innerText
  15.                 Next
  16.             Next
  17.         Next
  18.     End With
  19. End Sub
复制代码




评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2015-1-26 20:02 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
先用fiddler抓包,然后才能写代码,自己看一下论坛教程

TA的精华主题

TA的得分主题

发表于 2015-1-26 21:31 | 显示全部楼层
看看吴姐的不懂也来抓网页,互相交流一下。

TA的精华主题

TA的得分主题

发表于 2015-1-26 21:46 | 显示全部楼层
以下这个代码实验可行,就是500多页获取要花点时间,我也是刚学,欢迎讨论。
  1. Sub getzip()
  2.      On Error Resume Next
  3. [a1].CurrentRegion.Offset(1).Clear
  4.      With CreateObject("Microsoft.XMLHTTP")
  5.          For P = 0 To 502
  6.              .Open "GET", "http://usa.postcodebase.com/zh-hans/all?page=" & P, False
  7.              .send
  8.              Do Until .ReadyState = 4
  9.                  DoEvents
  10.              Loop
  11.              tt = .responseText
  12.              n = Range("a65536").End(xlUp).Row
  13.              temp = Split(Split(.responseText, "odd views-row-first")(1), "views-field views-field-field-zip")
  14.              For i = 1 To 100
  15.                 Cells(n + i, 1) = Split(Split(temp(i), "node/")(1), """>")(0)
  16.                 Cells(n + i, 2) = Split(Split(temp(i), """>")(1), "<")(0)
  17.                 Cells(n + i, 3) = Split(Split(temp(i), """>")(2), "<")(0)
  18.             Next i
  19.             Range("A65536").End(xlUp).Select
  20.          Next P
  21.      End With
  22. End Sub
复制代码

TA的精华主题

TA的得分主题

发表于 2015-1-26 21:46 | 显示全部楼层
  1. Sub getzip()
  2.      On Error Resume Next
  3. [a1].CurrentRegion.Offset(1).Clear
  4.      With CreateObject("Microsoft.XMLHTTP")
  5.          For P = 0 To 502
  6.              .Open "GET", "http://usa.postcodebase.com/zh-hans/all?page=" & P, False
  7.              .send
  8.              Do Until .ReadyState = 4
  9.                  DoEvents
  10.              Loop
  11.              tt = .responseText
  12.              n = Range("a65536").End(xlUp).Row
  13.              temp = Split(Split(.responseText, "odd views-row-first")(1), "views-field views-field-field-zip")
  14.              For i = 1 To 100
  15.                 Cells(n + i, 1) = Split(Split(temp(i), "node/")(1), """>")(0)
  16.                 Cells(n + i, 2) = Split(Split(temp(i), """>")(1), "<")(0)
  17.                 Cells(n + i, 3) = Split(Split(temp(i), """>")(2), "<")(0)
  18.             Next i
  19.             Range("A65536").End(xlUp).Select
  20.          Next P
  21.      End With
  22. End Sub
复制代码

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2015-1-26 21:49 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Sub getzip()
     On Error Resume Next
[a1].CurrentRegion.Offset(1).Clear
     With CreateObject("Microsoft.XMLHTTP")
         For P = 0 To 502
             .Open "GET", "http://usa.postcodebase.com/zh-hans/all?page=" & P, False
             .send
             Do Until .ReadyState = 4
                 DoEvents
             Loop
             tt = .responseText
             n = Range("a65536").End(xlUp).Row
             temp = Split(Split(.responseText, "odd views-row-first")(1), "views-field views-field-field-zip")
             For i = 1 To 100
                Cells(n + i, 1) = Split(Split(temp(i), "node/")(1), """>")(0)
                Cells(n + i, 2) = Split(Split(temp(i), """>")(1), "<")(0)
                Cells(n + i, 3) = Split(Split(temp(i), """>")(2), "<")(0)
            Next i
            Range("A65536").End(xlUp).Select
         Next P
     End With
End Sub

TA的精华主题

TA的得分主题

发表于 2015-1-26 21:57 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
怎么发带代码的贴子要审核,发不上

TA的精华主题

TA的得分主题

发表于 2015-1-26 22:13 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
5楼已经给出代码,但是500多页的数据确实很多,加上网站也比较慢,会出现假死状态,我也是刚学,欢迎讨论

TA的精华主题

TA的得分主题

发表于 2015-1-26 22:23 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
做了前面6页,参考一下
  1. Sub 按钮1_单击()
  2.     Dim url, html

  3.     Set html = CreateObject("htmlfile")
  4.     With CreateObject("msxml2.xmlhttp")
  5.         For a = 0 To 5
  6.             If a = 0 Then
  7.                 b = 0
  8.                 url = "http://usa.postcodebase.com/zh-hans/all"
  9.             Else
  10.                 b = 1
  11.                 url = "http://usa.postcodebase.com/zh-hans/all?page=" & a
  12.             End If
  13.             .Open "get", url, False
  14.             .send
  15.             s = .responsetext
  16.             html.body.innerhtml = s
  17.             Set tb = html.all.tags("table")(0).Rows
  18.             For i = b To tb.Length - 1
  19.                 n = n + 1
  20.                 For j = 0 To tb(i).childnodes.Length - 1
  21.                     Cells(n, j + 1) = tb(i).childnodes(j).innertext
  22.                 Next
  23.             Next
  24.         Next
  25.     End With
  26. End Sub
复制代码

usa.postcodebase.com.rar

7.68 KB, 下载次数: 35

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-20 13:05 , Processed in 0.037133 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表