ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 38061|回复: 79

[原创] 网页抓取小工具(IE法)

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2014-2-18 13:24 | 显示全部楼层 |阅读模式
本帖已被收录到知识树中,索引项:网页交互
用IE提取网页资料的好处在于:所见即所得,网页上能看到的信息一般都能获取。
本工具功能不多,主要是便于提取网页上展示的信息所在元素的代码。希望能对大家有点小帮助。
网页抓取小工具.rar (22.91 KB, 下载次数: 5247)
本工具使用方法:
1、在B1内输入网址,可以是已打开的网页,也可以是未打开的
2、A2和B2的内容不要更改,第二行的其他单元格可以自行输入元素的各属性名称。其中,innertext单元格有下拉选项
3、点击“开始分析”分析网页元素。
4、A列是各元素的对象代码。
5、在innertext列查找所需提取的内容后,选定该行,点击“生成excel”。
     可以提取Table标签的表格或下载IMG标签的图片。
6、在新生成的excel里,点击“执行代码”按钮,看是否能生成所需数据。

如果生成的数据和开始分析的数据不符,原因可能是:
1、网页未完全加载完毕,对应标签的数据尚未加载,代码自动提取了其后的标签数据。
   可能的解决方法:加上do...loop时间延迟。
2、网页为动态网页,标签的序号不定。
   可能的解决方法:元素有id名的话用getelementbyid("id名")名获取,没有的话抓包换xmlhttp法提取吧。
3、需要选择相关选项或需要登录才能提取。
   可能的解决方法:先做登录或选择相关选项等操作后再提取

评分

12

查看全部评分

TA的精华主题

TA的得分主题

发表于 2014-2-18 14:12 | 显示全部楼层
目前浏览器上的功能就有超强的分析功能了喔!

TA的精华主题

TA的得分主题

发表于 2014-2-18 14:21 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
多谢老师,学习收藏.

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-2-18 16:20 | 显示全部楼层
本帖最后由 wcymiss 于 2014-2-18 16:22 编辑
lolmuta 发表于 2014-2-18 14:12
目前浏览器上的功能就有超强的分析功能了喔!


我这个工具主要针对初学者的,浏览器可以分析,但无法给出具体的某个元素的vba代码。我的工具里可以直接生成网抓的vba代码。ajax、frame里的内容也能自动生成代码。

呃,,,高手可以pass。。。。。。

TA的精华主题

TA的得分主题

发表于 2014-2-23 22:13 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2014-2-24 14:52 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
吴姐出品 必属精品!!!!

TA的精华主题

TA的得分主题

发表于 2014-4-19 21:12 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2014-4-19 21:18 | 显示全部楼层
5、在innertext列查找所需提取的内容后,选定该行,点击“生成excel”。
     可以提取Table标签的表格或下载IMG标签的图片。
------------------------------
这个老师如能做个小例子,就更好了。。。。

TA的精华主题

TA的得分主题

发表于 2014-4-19 22:03 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2014-5-17 11:43 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-24 07:12 , Processed in 0.052714 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表