ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: Kaohsing

[讨论] 解析网页源码,获得所需数据。

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-14 18:19 | 显示全部楼层
本帖最后由 Kaohsing 于 2017-11-16 07:29 编辑

新三板公告URL http://xinsanban.eastmoney.com/a ... ortType=&sortRule=1,网页源码显示类似于xml格式。

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-14 19:44 来自手机 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
新三版的公告返回的数据与别的公告不一样,类似于xml,数据结构不一样,没法套用。需要另解析。

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-15 15:39 | 显示全部楼层
本帖最后由 Kaohsing 于 2017-11-15 17:56 编辑

js解析沪深A股公告单条数据的结构,修修剪剪后就这样啦,用空格及颜色表示了他们之间的关系:
    var GeyLybKP = {
                      "data":[{"NOTICEDATE":"2017-11-15T00:00:00+08:00",
                                  "NOTICETITLE":"601607:上海医药第六届董事会第十次会议及第十二次会议决议公告",
                                  "CDSY_SECUCODES":[
                                                                          {"SECURITYCODE":"601607","SECURITYFULLNAME":"上海医药"},
                                                                          {"SECURITYCODE":"02607","SECURITYFULLNAME":"上海医药",}],
                                  "ANN_RELCOLUMNS":[{"COLUMNCODE":"001002009","COLUMNNAME":"董事会决议公告",}],
                                   "ANN_RELCODES":[{"CODETYPE":"058001001","CODEMARKET":"069001001001"},
                                                                 {"CODETYPE":"058001003001","CODEMARKET":"069002004001",}],
                                   "EUTIME":"2017-11-15T12:44:40+08:00",
                                   "TABLEID":207000003501109922,
                                    "Order":999,
                                   "Url":"http://data.eastmoney.com/notices/detail/601607/AN20171115103 hJ.html"
                                    }],
                        "TotalCount":1000,       "pages":1000,     "rc":1,    "me":null,
                        "dataUrl":"http://newsnotice.eastmoney.com/we"
                  };

          红字、蓝字之间是平级关系或是兄弟关系。红字data与蓝字是上下级关系或父子关系,如果蓝字有下级,那与红字
是爷孙关系,有点绕。最后  GeyLybKP是红字的上级或父,蓝字是它孙。(js环境)
         再多说一句,font有size,name,颜色等等属性,获得字体的尺寸名字=font.size,font.name。有点类似,获得时间
“2017-11-15T00:00:00+08:00”,只需 GeyLybKP.data.NOTICEDATE,下面上图验证一下。
s1.png s2.png
        js中返回数据使用js.eval(), 好像用直接用GeyLybKP.data.NOTICEDATE,因为他下面有子子孙孙(或者叫分支,
树形关系,自己的理解),
改一下GeyLybKP.data[0].NOTICEDATE,其他大同小异。
s3.png
多数据时遍历一下,就可。





TA的精华主题

TA的得分主题

发表于 2017-11-15 21:12 | 显示全部楼层
Kaohsing 发表于 2017-11-15 15:39
js解析沪深A股公告单条数据的结构,修修剪剪后就这样啦,用空格及颜色表示了他们之间的关系:
    var GeyL ...

老师为啥会卡住?
CEGV531U}%OER2R2N5REHG2.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-15 21:44 来自手机 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
五指山888 发表于 2017-11-15 21:12
老师为啥会卡住?

选择哪一个公告会卡住?卡在哪里?我只是看它们外在数据表现机构一样,就默认了他们的内在机构一样,没有一一测试,可能有bug。

TA的精华主题

TA的得分主题

发表于 2017-11-15 21:45 | 显示全部楼层
Kaohsing 发表于 2017-11-14 19:44
新三版的公告返回的数据与别的公告不一样,类似于xml,数据结构不一样,没法套用。需要另解析。

新三板这里返回下responsetext,看到的依然是json格式数据。。

TA的精华主题

TA的得分主题

发表于 2017-11-15 21:50 | 显示全部楼层
fxl447098457 发表于 2017-11-15 21:45
新三板这里返回下responsetext,看到的依然是json格式数据。。

新三板返回的结果见立即窗口: 2017-11-15_214850.jpg

TA的精华主题

TA的得分主题

发表于 2017-11-15 22:31 | 显示全部楼层
Kaohsing 发表于 2017-11-15 21:44
选择哪一个公告会卡住?卡在哪里?我只是看它们外在数据表现机构一样,就默认了他们的内在机构一样,没有 ...

沪深a股公告, 卡在这一句:Pages = Split(Split(.responsetext, "pages"":")(1), ",""")(0),第一次可以用,以后就卡了
6N5$9`E09PU6A6BRVL][NZO.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-16 07:18 | 显示全部楼层
五指山888 发表于 2017-11-15 22:31
沪深a股公告, 卡在这一句:Pages = Split(Split(.responsetext, "pages"":")(1), ",""")(0),第一次可以 ...

服务器不给数据啦! 12.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-11-16 07:27 | 显示全部楼层
fxl447098457 发表于 2017-11-15 21:50
新三板返回的结果见立即窗口:


是的,当初看到的源码类似于xml,就贸然断定是xml,不妥。
s2.png


安卓手机与网页一样,苹果手机就给解析成逗号分隔的字符串。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-27 20:02 , Processed in 0.045457 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表