ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: shenzhenyang

[求助] 用 Power Query 提取网页数据

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-11-12 23:44 | 显示全部楼层

点赞   学到了

TA的精华主题

TA的得分主题

发表于 2023-11-13 00:16 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-11-13 09:27 | 显示全部楼层
一江春水1688 发表于 2023-11-13 00:16
重新做了一个按页码提取的代码:

这个代码发出来,我应该在PQ那个菜单加入这个代码,就可以获取数据,谢谢

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-11-13 10:14 | 显示全部楼层
一江春水1688 发表于 2023-11-13 00:16
重新做了一个按页码提取的代码:

1.png
2.png


  1. let
  2.    func = (page as any) =>
  3.            let
  4.                url="https://fx.cmbchina.com/api/y1/fx/history-rate/page",
  5.                headers=[#"Content-Type"="application/json;charset=UTF-8"],
  6.                query=[],
  7.                content="{""nbr"":""港币"",
  8.                ""startDate"":""2009-01-01"",
  9.                ""endDate"":""2050-11-12"",
  10.                ""pageSize"":""38"",
  11.                ""pageNum"":"& Text.From(page) & "}",
  12.                web=Text.FromBinary(web.Contents(url, [Headers=headers,Query=query,Content=Text.Tobinary (content)])),                  
  13.                data = Table.FromRecords(Json.Document(web)[body][list]),
  14.                删除的列 = Table.RemoveColumns(data,{"ccyNbrEng","upTime"}),
  15.                重排序的列 = Table.ReorderColumns(删除的列,{"ratDat","rthBid","rtcBid","rtbBid","rthOfr","rtcofr"}),
  16.                删除的列1 = Table.RemoveColumns(重排序的列,{"rtbBid"}),
  17.                重命名的列 = Table.RenameColumns(删除的列1,{{"ratDat","日期"},{"rthBid","汇买价"},
  18.                {"rtcBid","钞买价"},{"rthofr","汇卖价"},{"rtcofr","钞卖价"}})
  19.            in
  20.              重命名的列 ,   
  21.     result = Table.Combine(List.Transform({1..10}, each func(_)))//提取1至10页
  22. in
  23.     result
复制代码



帮我看这错误是哪里,谢谢

TA的精华主题

TA的得分主题

发表于 2023-11-13 15:06 | 显示全部楼层
对你的数据进行了修改,现在是可以的,供参考吧
image.jpg

网抓外汇数据.zip

176.36 KB, 下载次数: 1

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-11-13 15:11 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2023-11-13 15:25 | 显示全部楼层
shenzhenyang 发表于 2023-11-13 10:14
帮我看这错误是哪里,谢谢
  1. let
  2.     func = (page as any) =>
  3.         let
  4.             iPage = if page = -1 then 1 else page,
  5.             url="https://fx.cmbchina.com/api/v1/fx/history-rate/page",
  6.             headers=[#"Content-Type"="application/json;charset=UTF-8"],
  7.             //结束日期endDate,可以赋值为未来某一天,使得查询到的都是最新数据;每页行数pageNum,可以是38或100等数据
  8.             content="{""nbr"":""港币"",
  9.                 ""startDate"":""2009-01-01"",
  10.                 ""endDate"":""2055-11-12"",
  11.                 ""pageSize"":""38"",
  12.                 ""pageNum"":" & Text.From(iPage) & "}",
  13.             web=Text.FromBinary(Web.Contents(url,[Headers=headers,Content=Text.ToBinary(content)])),
  14.             总页数 = Json.Document(web)[body][pages],
  15.             data = Table.FromRecords(Json.Document(web)[body][list],{"ratDat", "rthBid", "rtcBid", "rthOfr", "rtcOfr"}),
  16.             重命名的列 = Table.RenameColumns(data,{{"ratDat", "日期"}, {"rthBid", "汇买价"}, {"rtcBid", "钞买价"}, {"rthOfr", "汇卖价"}, {"rtcOfr", "钞卖价"}})
  17.         in
  18.             if page = -1 then 总页数 else 重命名的列,
  19.     总页数 = func(-1),
  20.     result = Table.Combine(List.Transform({1..10}, each func(_)))  //提取1至10页
  21. in
  22.     result
复制代码


TA的精华主题

TA的得分主题

发表于 2023-11-13 16:38 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
shenzhenyang 发表于 2023-11-13 10:14
帮我看这错误是哪里,谢谢

我提供的代码,只能查询到2014-7-10,网站上对应的是第90页,查询更早的数据会出错。
追踪了返回的代码,发现早期的数据,网站返回的数据中,没有rtcOfr即钞卖价数据(注意,是没有而不是空)。所以,代码处理数据时,因找不到rtcOfr字段而出错。
另外,对比了网站所有数据,除了2014-7-10这天,所有的钞卖价都等于汇卖价。因此,感觉8楼一次性返回所有数据的代码更有用。

TA的精华主题

TA的得分主题

发表于 2023-11-13 17:21 | 显示全部楼层
一江春水1688 发表于 2023-11-13 16:38
我提供的代码,只能查询到2014-7-10,网站上对应的是第90页,查询更早的数据会出错。
追踪了返回的代码 ...


巧改网站查询参数,一次取一万条,可以不分页,代码稍后提供
无标题.png

TA的精华主题

TA的得分主题

发表于 2023-11-13 17:22 | 显示全部楼层
一江春水1688 发表于 2023-11-13 17:21
巧改网站查询参数,一次取一万条,可以不分页,代码稍后提供

代码如下:

  1. let
  2.     url="https://fx.cmbchina.com/api/v1/fx/history-rate/page",
  3.     page = 1,
  4.     headers=[#"Content-Type"="application/json;charset=UTF-8"],
  5.     //2014-07-10至2050-11-12,一次性取1万条数据,这样就不用分页了,实际返回没有这么多;更早的数据会出错。
  6.     content="{""nbr"":""港币"",
  7.     ""startDate"":""2014-07-10"",
  8.     ""endDate"":""2050-11-12"",
  9.     ""pageSize"":""10000"",
  10.     ""pageNum"":" & Text.From(page) & "}",
  11.     web=Text.FromBinary(Web.Contents(url,[Headers=headers,Content=Text.ToBinary(content)])),
  12.     data = Table.FromRecords(Json.Document(web)[body][list],{"ratDat", "rthBid", "rtcBid", "rthOfr", "rtcOfr"}),
  13.     重命名的列 = Table.RenameColumns(data,{{"ratDat", "日期"}, {"rthBid", "汇买价"}, {"rtcBid", "钞买价"}, {"rthOfr", "汇卖价"}, {"rtcOfr", "钞卖价"}})
  14. in
  15.     重命名的列
复制代码


您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-26 14:33 , Processed in 0.046215 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表