ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1689|回复: 4

使用Power Query网抓新冠肺炎数据实例操作

[复制链接]

TA的精华主题

TA的得分主题

发表于 2020-11-23 18:14 | 显示全部楼层 |阅读模式
前端时间学python,使用爬虫爬取腾讯新闻新冠疫情数据
现在发现Power query也可以直接爬取,获取的json文件可以在Power query中层层获取所需要的数据。
但腾讯的json文件中,国外数据只有一个总数据是每天更新的,除美国之外的daily数据只更新到3-4月份。
1. 打开tencent xw网页到新冠肺炎页面。https://news.qq.com/zt2020/page/feiyan.htm
2. 右键->Inspect(Ctrl+Shift+I)->网络-> Ctrl+R查看数据包->JS会出现下面画面->逐一点击会看到有大的文件,下面连续两个文件1个是中国的,一个事国外的

查源

查源

3. 选择这个JS文件,然后右键->Copy-> Copy link address.
4. 打开Excel, Data-> From Other Source->From Web, 将所复制的地址粘贴,但是要删除地址中Jquery后面的一段,“jQuery3510941964199952747_1606125555402&_=1606125555403”, 否则会识别不了,具体原因不知道(下载下来后,里面多了2个“”,删除后可以用json正常导入,python里可以复制整段,然后点击确定。
5. 打开后就是Record, 我们需要data里面的数据得到json文件,然后用Json.Document读取此文件。

Json读取

Json读取

6. 这样就完整读取了整个数据。要想具体读取,就使用PQ里面的函数得到你想要的数据就可以。
Capture.PNG

COV19.zip

231.37 KB, 下载次数: 42

评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2020-11-25 14:31 | 显示全部楼层
看了一眼楼主的办法,感觉有点麻烦,很多时候这类有规律变化的网址都是采用别的办法去抓取的
当然网站抓取其实各有千秋,主要的还是那种方法舒服用那种
1.png
2.png
3.png
4.png
5.png

全国疫情.zip

44.83 KB, 下载次数: 37

TA的精华主题

TA的得分主题

发表于 2020-11-27 11:06 | 显示全部楼层
cai747657902 发表于 2020-11-25 14:31
看了一眼楼主的办法,感觉有点麻烦,很多时候这类有规律变化的网址都是采用别的办法去抓取的
当然网站抓取 ...

请教类似的案例,我想拿到当前页面下有多少条记录(导出清单),怎么操作呢?useragent 怎么找到的呢?
2333.jpg

UAT 05-06-2020 V2.zip

516.77 KB, 下载次数: 13

TA的精华主题

TA的得分主题

发表于 2020-11-27 11:35 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
15221387005 发表于 2020-11-27 11:06
请教类似的案例,我想拿到当前页面下有多少条记录(导出清单),怎么操作呢?useragent 怎么找到的呢?

excel 中power query 链接倒是数据源时,和你的截图不同?

power query :from web

power query :from web

TA的精华主题

TA的得分主题

发表于 2020-11-27 16:32 | 显示全部楼层
15221387005 发表于 2020-11-27 11:35
excel 中power query 链接倒是数据源时,和你的截图不同?

https://pqfans.com/207.html
去看一下,不同的类型有不同的抓取方法
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-15 16:36 , Processed in 0.040952 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表