ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: liu-aguang

[原创] 网页数据采集---网页文档解析篇(json/html/xml)

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2017-7-10 12:32 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互
其他数据库比如, DB2、SQL Server、Sybase、Informix、MySQL、VF 等等,也不熟悉,也不知道与vba能否关联
若用wps表格,建立、删除、追加没问题,但表格只有65536行太少,且不能象access检索,不行
若用txt文件,问题也出在检索上,须分割后逐行判断,也不行

TA的精华主题

TA的得分主题

 楼主| 发表于 2017-7-10 15:53 | 显示全部楼层
smhf_6 发表于 2017-7-10 12:32
其他数据库比如, DB2、SQL Server、Sybase、Informix、MySQL、VF 等等,也不熟悉,也不知道与vba能否关联
...

毫无疑问, 大数据存取和访问管理使用数据库是最优选择. 即使EXCEL或WPS可以容纳, 但操作运行也会像蜗牛一般, 难以容忍. VBA应用ADO技术访问SQL Server/MYSQL的实现, 论坛上有较多的案例, 值得你去研究借鉴.
JSON或XML管理数据, 也能实现数据管理的各项功能, 但其检索也存在与Txt检索一样的问题----只有通过遍历判断实现;  至于效率肯定不如数据库方式. 它们存在的最大理由是不同平台之间数据交换的兼容性和网页解析的便宜性.

TA的精华主题

TA的得分主题

发表于 2017-7-11 09:17 | 显示全部楼层
非常非常感谢liu-aguang老师的指点, 看样子一开始我的方向就错误了,还是用数据库吧,不过,要不是查找 关于xml的资料,那就漏掉了这篇好文章,您写的太好了,我还是有收获的。
谢谢

TA的精华主题

TA的得分主题

发表于 2017-8-21 11:35 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-8-21 14:15 | 显示全部楼层

今天才拜读老师的大作,写的真好。一系列文档实例的应用,恍然有种强几天深读BeautifulSoup 的文档的感觉。还要反复学习。HTMLDocument方式解析网页,论坛上只有一鳞半爪的几个范例,而像老师写的这么系统的还是头一份。非常优秀的作品分享,感谢感谢。

TA的精华主题

TA的得分主题

发表于 2017-9-14 11:50 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
学习了,感谢老师无私奉献和辛苦整理的版友

TA的精华主题

TA的得分主题

发表于 2017-10-1 16:33 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
学习学习学习学习学习学习学习学习学习

TA的精华主题

TA的得分主题

发表于 2017-10-5 18:06 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-10-9 22:09 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-12-3 17:45 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 lms008 于 2017-12-3 17:49 编辑

向老师请教@liu-aguang,我想把xml 中有row 对应的记录相关的 item  visible="true" 的value 值保存到excel 文档中?请问如何过滤这些记录呢?
xml的结构如下:
<lov id="MasterSearchLOV" name="null" xsl="style/masterEnquiry.xsl">
<search id="MasterSearchLOV_search">...</search>
<recordSet>
<header>...</header>
<content>
<row order="odd">
<item visible="false">...</item>
<item visible="true">HK17112202473392</item>
<item visible="true">CREDIT CARDS</item>
<item visible="true">CHAN TAI MAN</item>
<item visible="false">1241</item>
<item visible="false">2029</item>
<item visible="false">01</item>
<item visible="true">HKSPG17VAWV000</item>
<item visible="true">HKID / A1234563</item>
<item visible="false">90</item>
<item visible="false">A1234563</item>
<item visible="false"></item>
<item visible="false">9999999</item>
<item visible="false"></item>
<item visible="false"></item>
<item visible="true">PRESCREEN</item>
<item visible="true">PENDING</item>
<item visible="true">AIP</item>
<item visible="true">2017-11-22 00:00:00.0</item>
<item visible="false"/>
<item visible="true"/>
<item visible="false">1002</item>
<item visible="false">Y</item>
<item visible="false"/>
<item visible="false">3007</item>
<item visible="false"/>
<item visible="false"/>
<item visible="false">-</item>
<item visible="false"/>
<item visible="false"></item>
<item visible="false"/>
<item visible="false"/>
<item visible="false"></item>
<item visible="false">HKR1206-22112017154134-22804</item>
<item visible="false"></item>
<item visible="false"></item>
<item visible="false">-</item>
<item visible="false"></item>
<item visible="false"></item>
<item visible="false"/>
<item visible="false"></item>
<item visible="false"></item>
</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
<row order="odd">...</row>
<row order="even">...</row>
</content>
</recordSet>
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-20 20:42 , Processed in 0.047175 second(s), 5 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表