ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3495|回复: 10

[求助] 请教论坛老师,如何网抓这个网址里数据,谢谢。

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:05 | 显示全部楼层 |阅读模式
刚接解网抓,学了点皮毛,对网页http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sh,想提取里面数据而不得其法,另http://club.excelhome.net/thread-1093639-2-1.htmlccwan 老师的代码又看不懂,请各位老师帮忙解决一下,谢谢。

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:39 | 显示全部楼层
周末了,闲来无事,写一个吧!!!
  1. Sub main()
  2.     Dim strText$, arrData(1 To 6000, 1 To 4), i&, n&, j&
  3.     Sheets(1).Select: Sheets(1).Cells.Clear: Sheets(1).Range("a:d").NumberFormat = "@"
  4.     Sheets(1).[A1:D1] = [{"股份代号","股份名称","于中央结算系统的持股量","占于上交所上市及交易的A股总数的百分比"}]
  5.     With CreateObject("msxml2.xmlhttp")
  6.         .Open "GET", "http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sh", False
  7.         .send
  8.         Do While .readyState <> 4
  9.             DoEvents
  10.         Loop
  11.         strText = .responseText
  12.     End With
  13.     With CreateObject("htmlfile")
  14.         .write strText
  15.         For Each TR In .all.tags("table")(2).Rows
  16.             i = i + 1: j = 0
  17.             If i >= 3 Then
  18.                 n = n + 1
  19.                 For Each TD In TR.Cells
  20.                     j = j + 1
  21.                     arrData(n, j) = TD.innerText
  22.                 Next
  23.             End If
  24.         Next
  25.     End With
  26.     Sheets(1).Range("a2").Resize(n, 4) = arrData
  27. End Sub
复制代码

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:41 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:47 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
这个静态的好抓。把网页抓下来,用解析器提取就可以了。

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-9-14 21:11 | 显示全部楼层
chentonny 发表于 2018-9-14 20:47
这个静态的好抓。把网页抓下来,用解析器提取就可以了。

网页有个日期控件,若选择其他日期的数据又如何呢?谢谢

TA的精华主题

TA的得分主题

发表于 2018-9-14 21:13 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-9-14 21:14 来自手机 | 显示全部楼层
tsmcp 发表于 2018-9-14 21:11
网页有个日期控件,若选择其他日期的数据又如何呢?谢谢

如果是这样,那是另外的一个问题,那么你又开新帖提问。

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-9-14 21:56 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
duquancai 发表于 2018-9-14 21:14
如果是这样,那是另外的一个问题,那么你又开新帖提问。

哦,谢谢。

TA的精华主题

TA的得分主题

发表于 2018-9-14 23:52 | 显示全部楼层
你不能再用'GET‘,要改为'POST',并且要构建请求头,其中包括 ’today:dates‘, 再建一个你想查找的日期集合,遍历这个集合,就可以一次抓取多日的数据。

TA的精华主题

TA的得分主题

发表于 2018-9-15 00:48 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
dates变量要由3个字符串连结,如a & b & c, a、b、c分别代表年、月、日,如”2018“、"09"、"11"
再把a传递给表单参数 'ddlShareholdingYear'
把b传递给表单参数  'ddlShareholdingMonth'
把c传递给表单参数  'ddlShareholdingDay'
再建一个由abc组成的集合,把你想抓取数据的所有日期写入这个集合。
搞定

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-15 13:59 , Processed in 0.026080 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表