ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 461|回复: 6

[求助] PQ网抓遇到的问题,请问我这到底是错在哪了。

[复制链接]

TA的精华主题

TA的得分主题

发表于 2022-9-23 20:19 | 显示全部楼层 |阅读模式
今天试着抓取这个网站的数据http://fdc.zfj.xm.gov.cn/search/commercial_property,最后一步Web.Contents为什么就是解析不出来,提示Expression.Error: Web.Page 不支持 Web.Contents“内容”选项。,这个错误我遇到好几次了,到底是什么意思,网上也没有具体的讲法。

let
    PageList = {1..203},
    headers = [#"Content-Type"="application/json; charset=utf-8",Referer="http://fdc.zfj.xm.gov.cn/search/commercial_property"],
    url = "http://fdc.zfj.xm.gov.cn/home/Getzslp",
    content = "currentpage=1&pagesize=20&searchtj=&orderby=",
    自定义1 = Web.Page(Web.Contents(url, [Headers=headers,Content=Text.ToBinary(content)]))
in
    自定义1



TA的精华主题

TA的得分主题

发表于 2022-9-24 12:38 | 显示全部楼层
let
    url = "http://fdc.zfj.xm.gov.cn/home/Getzslp",
    headers = [#"Content-Type"="application/x-www-form-urlencoded; charset=UTF-8"],
    content = Text.ToBinary("currentpage=1&pagesize=9999"),
    web = Text.FromBinary(Web.Contents(url, [Headers=headers, Content=content])),
    data = Text.Remove(Text.Range(web, Text.PositionOf(web, "[")+1, Text.PositionOf(web, "recordcount")-Text.PositionOf(web, "[")-5),"\"),
    list = Text.Split(Text.Replace(data, "},", "}|"), "|"),
    tb = Table.FromRecords(List.Transform(list, each Json.Document(_)))
in
    tb

TA的精华主题

TA的得分主题

 楼主| 发表于 2022-9-26 09:02 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
Eric0236 发表于 2022-9-24 12:38
let
    url = "http://fdc.zfj.xm.gov.cn/home/Getzslp",
    headers = [#"Content-Type"="application ...

我想问的是我上面的步骤到底错在哪里呢。我看不出来啊。

TA的精华主题

TA的得分主题

发表于 2022-9-26 12:31 | 显示全部楼层
fengbao008 发表于 2022-9-26 09:02
我想问的是我上面的步骤到底错在哪里呢。我看不出来啊。

Content-Type把请求头的内容复制进去,而不是响应头的内容

TA的精华主题

TA的得分主题

发表于 2022-9-27 15:32 | 显示全部楼层
Eric0236 发表于 2022-9-26 12:31
Content-Type把请求头的内容复制进去,而不是响应头的内容

请问这网页的headers等参数是在哪找到的,我只会最基本的network-doc,找不到啊

TA的精华主题

TA的得分主题

发表于 2022-9-27 16:12 | 显示全部楼层
打开网页按F12,点击网络,刷新一下页面,点击第一条,右边消息头里面找相关信息
图片.png

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2022-9-29 09:06 | 显示全部楼层
Eric0236 发表于 2022-9-26 12:31
Content-Type把请求头的内容复制进去,而不是响应头的内容

晕死啊,半天看不出来。还以为是Content的问题。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-16 13:40 , Processed in 0.034712 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表