ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: Kaohsing

[讨论] 解析网页源码,获得所需数据。

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-4 15:09 | 显示全部楼层
本帖最后由 Kaohsing 于 2017-11-6 19:22 编辑

一步一步优化提取的数据(js法)(一)
目标:

s1.png




数据结构:
s2.png 数据是个jsonp,所需数据就在data数组中,里面嵌套json,遍历它就是
s3.png
s4.png
好像以前写过,数据是出来,但是格式不对。那就另一楼完善吧。

TA的精华主题

TA的得分主题

发表于 2017-11-4 15:44 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Kaohsing 发表于 2017-11-4 15:09
占楼。。。。。。。。。。。。。。。。。。。。。。

搞死了,玩不了了。。。靠,都还没干啥,直接把IP封了。 88.PNG


TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-6 18:53 | 显示全部楼层
本帖最后由 Kaohsing 于 2017-11-6 20:45 编辑

一步一步优化提取的数据(js法)(二) s3.png
      本想有js语句处理数据格式,又怕语句臃肿,就录了个宏了事。处理里面的utc时间格式,耽误不少时间,
由于不牵扯小时 就用repalce替换出了时间。split的好像以前讲过类似,不在赘述。
分红送股.zip (145.13 KB, 下载次数: 81)

评分

2

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-6 20:34 | 显示全部楼层
本帖最后由 Kaohsing 于 2017-11-7 09:31 编辑

一步一步优化提取的数据(js法)(三)

提供两种方法取出所有的源码数据。


s1.png

分红送股.zip (183.19 KB, 下载次数: 60)

TA的精华主题

TA的得分主题

发表于 2017-11-6 23:25 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Kaohsing 发表于 2017-11-6 18:53
一步一步优化提取的数据(js法)(二)
      本想有js语句处理数据格式,又怕语句臃肿,就录了个宏了事。 ...

老师做的很好了,假如能在d1单元格输入日期就能选择不同季度抓取更好了,没有也可以很好用了,谢谢了

TA的精华主题

TA的得分主题

发表于 2017-11-6 23:28 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Kaohsing 发表于 2017-11-6 18:53
一步一步优化提取的数据(js法)(二)
      本想有js语句处理数据格式,又怕语句臃肿,就录了个宏了事。 ...

老师的注释需要时间慢慢消化了,难得的教材。

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-7 06:58 来自手机 | 显示全部楼层
         财经类网站,返回的数据一般都是js的数组,数组嵌套,或者是json,学点js有必要。

TA的精华主题

TA的得分主题

发表于 2017-11-7 07:51 来自手机 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-7 09:11 | 显示全部楼层
本帖最后由 Kaohsing 于 2017-11-8 09:04 编辑

  一个简单的实例 s1.png    s2.png
    获取图中数据                                                                           源码中的数据

    就不抓取网站的数据了,省去麻烦服务器,抓自己的静态网页。抓取价格,分析源码得知数据在data数组中,那就把他返回就是。
x = Split(Split(tt, "var series =  [")(1), "]")(0) & "]}" ,这样就得到了数据,但是没有变量名(自己理解的),那就加一个就是,
"var ghb=" & x ,再配合js的遍历语句,就得到了数据.
s3.png
源码:
Sub kaohsing_解析本地html3()
    Set HTML = CreateObject("HTMLFile")
    Set win = CreateObject("microsoft.xmlhttp")
    With win
        .Open "GET", "C:\Users\Administrator\Desktop\fullyear.html", False
        .send
       tt = .responseText
    End With
    x = Split(Split(tt, "var series =  [")(1), "]")(0) & "]}"
    Stop
   js = "var ghb=" & x & ";var b=ghb.data;var j=1;var i=1; for(x in b){rng(i,1)=b[x];i++;} "
   Debug.Print js
    With CreateObject("msscriptcontrol.scriptcontrol")
        .Language = "javascript"
        .AddObject "rng", [a1]
        .eval (js)

    End With
    Stop
End Sub

所用html文件: fullyear.zip (2.93 KB, 下载次数: 46)

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-8 08:48 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 Kaohsing 于 2017-11-13 20:06 编辑

45楼code
Sub kaohsing()
  '  MODIFY 11/13
    Application.DisplayAlerts = False
    Dim Pages%
    Dim tt$, strJs$
    sURL$ = "http://data.eastmoney.com/notices/getdata.ashx?StockCode=&FirstNodeType=0&CodeType=1&PageIndex=1&PageSize=5&jsObj=GeyLybKP&SecNodeType=0"
    sRefer$ = "http://data.eastmoney.com/yjfp/"
    With CreateObject("WinHttp.WinHttpRequest.5.1")
        .Open "GET", sURL, False
        .setrequestheader "Referer", sRefer
        .send
        DoEvents
        tt = .responseText
    End With

    Set reg = CreateObject("vbscript.regexp")
    reg.Pattern = "NOTICEDATE"":""(.*?)T.*?,""NOTICETITLE"":""(.*?)"",.*?""SECURITYCODE"":""(.*?)"",""SECURITYFULLNAME"":""(.*?)"".*?COLUMNNAME"":""(.*?)"",""NodeName"
    reg.Global = True
    Set mh = reg.Execute(tt)

End Sub

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-27 08:40 , Processed in 0.041246 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表