ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

   
高效办公必会的Office实战技巧 永久免费,网表让Excel秒变数据库 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
Excel不给力? 何不试试FoxTable! Excel函数公式学习大典 第2届Power BI可视化大赛,拿超级大奖! 免费下载Excel行业应用视频
300集Office 2010微视频教程 Tableau-数据可视化工具 打造核心竞争力的职场宝典 13门Excel免费公开课任你学
你的Excel 2010实战技巧学习锦囊 欲罢不能, 过目难忘的 Office 新界面 免费的Excel考勤计算系统
查看: 219|回复: 10

[求助] 请教论坛老师,如何网抓这个网址里数据,谢谢。

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:05 | 显示全部楼层 |阅读模式
刚接解网抓,学了点皮毛,对网页http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sh,想提取里面数据而不得其法,另http://club.excelhome.net/thread-1093639-2-1.htmlccwan 老师的代码又看不懂,请各位老师帮忙解决一下,谢谢。

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:39 | 显示全部楼层
周末了,闲来无事,写一个吧!!!
  1. Sub main()
  2.     Dim strText$, arrData(1 To 6000, 1 To 4), i&, n&, j&
  3.     Sheets(1).Select: Sheets(1).Cells.Clear: Sheets(1).Range("a:d").NumberFormat = "@"
  4.     Sheets(1).[A1:D1] = [{"股份代号","股份名称","于中央结算系统的持股量","占于上交所上市及交易的A股总数的百分比"}]
  5.     With CreateObject("msxml2.xmlhttp")
  6.         .Open "GET", "http://sc.hkexnews.hk/TuniS/www.hkexnews.hk/sdw/search/mutualmarket_c.aspx?t=sh", False
  7.         .send
  8.         Do While .readyState <> 4
  9.             DoEvents
  10.         Loop
  11.         strText = .responseText
  12.     End With
  13.     With CreateObject("htmlfile")
  14.         .write strText
  15.         For Each TR In .all.tags("table")(2).Rows
  16.             i = i + 1: j = 0
  17.             If i >= 3 Then
  18.                 n = n + 1
  19.                 For Each TD In TR.Cells
  20.                     j = j + 1
  21.                     arrData(n, j) = TD.innerText
  22.                 Next
  23.             End If
  24.         Next
  25.     End With
  26.     Sheets(1).Range("a2").Resize(n, 4) = arrData
  27. End Sub
复制代码

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:41 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-9-14 20:47 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-9-14 21:11 | 显示全部楼层
chentonny 发表于 2018-9-14 20:47
这个静态的好抓。把网页抓下来,用解析器提取就可以了。

网页有个日期控件,若选择其他日期的数据又如何呢?谢谢

TA的精华主题

TA的得分主题

发表于 2018-9-14 21:13 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-9-14 21:14 来自手机 | 显示全部楼层
tsmcp 发表于 2018-9-14 21:11
网页有个日期控件,若选择其他日期的数据又如何呢?谢谢

如果是这样,那是另外的一个问题,那么你又开新帖提问。

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-9-14 21:56 | 显示全部楼层
duquancai 发表于 2018-9-14 21:14
如果是这样,那是另外的一个问题,那么你又开新帖提问。

哦,谢谢。

TA的精华主题

TA的得分主题

发表于 2018-9-14 23:52 | 显示全部楼层
你不能再用'GET‘,要改为'POST',并且要构建请求头,其中包括 ’today:dates‘, 再建一个你想查找的日期集合,遍历这个集合,就可以一次抓取多日的数据。

TA的精华主题

TA的得分主题

发表于 2018-9-15 00:48 | 显示全部楼层
dates变量要由3个字符串连结,如a & b & c, a、b、c分别代表年、月、日,如”2018“、"09"、"11"
再把a传递给表单参数 'ddlShareholdingYear'
把b传递给表单参数  'ddlShareholdingMonth'
把c传递给表单参数  'ddlShareholdingDay'
再建一个由abc组成的集合,把你想抓取数据的所有日期写入这个集合。
搞定

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关注官方微信,高效办公专列,每天发车

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2018-9-25 07:17 , Processed in 0.076245 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2017 Wooffice Inc.

   

沪公网安备 31011702000001号 沪ICP备11019229号

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:徐怀玉律师 李志群律师

快速回复 返回顶部 返回列表