ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 2958|回复: 5

[求助] 使用PowerQuery自动抓取某度搜索结果首项的网页链接

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-3-25 20:31 | 显示全部楼层 |阅读模式
为了提高工作效率,不加班,所以弄了一个excel表,以达成:在首列输入一个公司的名字,通过PowerQuery完成在某度搜索关键字“公司名(空格) site:www.tianyancha.com”,在第二列返回某度搜索结果首项的页面URL。我用了Web.Contents函数,可是返回的结果里面死活找不到首项的返回地址.....所以跑来求助各位大神。此奉上示例文件以及预付我的膝盖..... 示例文件(含M公式).rar (16.7 KB, 下载次数: 44)


由于示例文件用2010制作,怕大神们的2010以上版本无法打开。因此描述文件制作过程:
1.首列字段名“公司名”,第二行输入“广州市诺信数字测控设备有限公司”;
2.加载至PQ
3.添加自定义列,输入=Web.Contents("https://www.baidu.com/s?wd="&[公司名]&"%20site%3Awww.tianyancha.com"),返回Binary数据,展开....然后就没有然后了



TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-27 07:14 来自手机 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
再次求救!

TA的精华主题

TA的得分主题

发表于 2018-3-29 07:22 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
利用Text.FromBinary()返回网页文本,然后进行Text.Split()几次就能得到你要的url了、

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-3-29 23:15 来自手机 | 显示全部楼层
fxl447098457 发表于 2018-3-29 07:22
利用Text.FromBinary()返回网页文本,然后进行Text.Split()几次就能得到你要的url了、

谢帅哥答!能请您上传一下示例文件吗?

TA的精华主题

TA的得分主题

发表于 2018-3-30 07:26 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
adasmith 发表于 2018-3-29 23:15
谢帅哥答!能请您上传一下示例文件吗?

let
    源 = Excel.CurrentWorkbook(){[Name="表1_2"]}[Content],
    web= Table.AddColumn(源, "网址", each Text.Split(Text.Split(Text.Split(Text.FromBinary(Web.Contents("http://www.baidu.com/s?wd="
    &[公司名]&"%20site%3Awww.tianyancha.com")),"result c-container "" id=""1"""){1},"href="""){1},""""){0})
in
    web

TA的精华主题

TA的得分主题

发表于 2019-4-11 11:12 | 显示全部楼层
fxl447098457 发表于 2018-3-30 07:26
let
    源 = Excel.CurrentWorkbook(){[Name="表1_2"]}[Content],
    web= Table.AddColumn(源, "网 ...

QQ图片20190411110916.png
web= Table.AddColumn(源, "网址", each Text.Split(Text.Split(Text.Split(Text.FromBinary(Web.Contents("http://www.baidu.com/s?wd="
    &[公司名]&"%20site%3Awww.tianyancha.com")),"result c-container "" id=""1"""){1},"href="""){1},""""){0})


请问老师这一步是怎么理解的,能不能帮忙讲解下。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-20 21:56 , Processed in 0.044838 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表