ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
12
返回列表 发新帖

[求助] Excel获取网页中的数据问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2022-6-25 16:59 | 显示全部楼层
image.jpg
查看标头就是网址了

TA的精华主题

TA的得分主题

 楼主| 发表于 2022-6-26 23:33 | 显示全部楼层
mlexcel12 发表于 2022-6-25 16:59
查看标头就是网址了

抓出来是这个样子的。。。

QQ截图20220626233115.png

TA的精华主题

TA的得分主题

发表于 2022-6-27 15:07 | 显示全部楼层
在表格中写公式抓取网页中的数据,推荐使用Excel网络函数库的网页抓取公式

GetWebContentById(Url, Element_id, [Encoding], [Method], [Headers])。根据网页元素id查找指定网页Url中的数据。Encoding指网页编码,默认GB2312;Method指访问类型包括GET或POST两种方式,默认GET方式;Headers指请求头,多个Header每一行放置一个,例如Host: open.onebox.so.com

GetWebContentByClassName(Url, Element_id,[Encoding], [Method], [Headers])。根据网页元素的样式class属性查找指定网页Url中的数据。

GetTableByIdW(Url, Table_id)。在Excel表格或WPS表格中,抓取指定网页中某张表格的数据。Url指网页的网址,Table_id指网页中待抓取表格的id。

GetTableByClassNameW(Url, Class_name, [Index])。Url指网页的网址,Class_name指网页中待抓取表格的class名称,由于相同class名称的表格可能有多个,可使用参数Index来标识,默认取第一个表格。

GetXPathW()(Url)其中Url指待抓取网页地址

GetWebContentByXPathW(Url, XPath)其中XPath指的是网页XPath地址,可通过GetXPathW()返回地址。这里不能直接使用Firefox或Chrome浏览器拾取的XPath,存在差异,导致无法正确返回结果。示例:如何查汉字拼音和音标

GetWebContentByIdW(Url, XPath)

GetWebContentByClassNameW(Url, XPath)

GetImgW(Url, Filter)

其中Filter指筛选关键词,如果设置了Filter,那么函数仅返回包含了Filter关键词的图片地址。

GetLinkW(Url, Filter)

其中Filter指筛选关键词,如果设置了Filter,那么函数仅返回包含了Filter关键词的Link地址。

基本原理:先通过GetXPathW()函数与Excel浏览器将待抓取网页的数据下载到本地数据库,再通过数据抓取函数抓取目标数据。这样做的好处是提供数据抓取效率,尤其是一个网页抓取的数据项比较多的情形。

网页数据抓取W系列函数,包括GetXPathW()、GetWebContentByXPathW()、GetWebContentByIdW()、GetWebContentByClassNameW()、GetImgW()、GetLinkW()等函数,其中W指Web browser的简称,指浏览器,W系列函数需要借助Excel浏览器。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-11 19:47 , Processed in 0.042974 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表