ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: onlycxb

[分享] 网页抓取分享

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2014-10-31 11:14 | 显示全部楼层
onlycxb 发表于 2014-10-31 11:01
Sub CopyToClipbox(strText As String)
    '文本拷贝到剪贴板
    With CreateObject("new:{1C3B4210-F4 ...

可拷贝到剪贴板后,再粘贴回记事本时,依然如故。

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-31 11:15 | 显示全部楼层
本帖最后由 onlycxb 于 2014-10-31 11:21 编辑

这个是需要转码的
js本身就具有转此码功能。

TA的精华主题

TA的得分主题

发表于 2014-10-31 11:26 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
onlycxb 发表于 2014-10-31 11:15
这个是需要转码的
js本身就具有转此码功能。

试过你曾经用过的 encodeURI函数进行转码,不成功。
再尝试吴姐介绍过的多种转码方法,依然失败。
另,想知道js.eval是否具有转码功能?

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-31 11:40 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 onlycxb 于 2014-10-31 11:42 编辑
VBA万岁 发表于 2014-10-31 11:26
试过你曾经用过的 encodeURI函数进行转码,不成功。
再尝试吴姐介绍过的多种转码方法,依然失败。
另, ...
  1. Sub 百度地图_北京地铁1号钱()
  2.     Dim url, js, p, slen, i, n
  3.     Set js = CreateObject("scriptcontrol")
  4.     [a2:b20].ClearContents
  5.     js.Language = "jscript"
  6.     For p = 1 To 4
  7.         url = "http://map.baidu.com/"
  8.         url = url & "?newmap=1"
  9.         url = url & "&qt=s"
  10.         url = url & "&c=218"
  11.         url = url & "&wd=北京地铁1号线"
  12.         url = url & "&nn=" & (p - 1) * 10
  13.         url = url & "&ie=utf-8"
  14.         With CreateObject("msxml2.xmlhttp")
  15.             .Open "get", url, False
  16.             .send
  17. '这里加上了多余的debug.print及unescape函数
  18.             Debug.Print unescape(.responsetext)
  19.             
  20.             js.addcode ("dy= " & .responsetext)
  21.             slen = js.Eval("dy.content.length") - 1
  22.             For i = 0 To slen
  23.                 n = n + 1
  24.                 Cells(n + 1, 1) = js.Eval("dy.content[" & i & "].name")
  25.                 Cells(n + 1, 2) = js.Eval("dy.content[" & i & "].addr")
  26.                 Cells(n + 1, 3) = js.Eval("dy.content[" & i & "].alias")
  27.             Next
  28.         End With
  29.     Next
  30. End Sub



  31. Function unescape(strTobecoded As String) As String
  32.     With CreateObject("msscriptcontrol.scriptcontrol")
  33.         .Language = "JavaScript"
  34.         unescape = .Eval("unescape('" & strTobecoded & "');")
  35.     End With
  36. End Function
复制代码

TA的精华主题

TA的得分主题

发表于 2014-10-31 11:48 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 VBA万岁 于 2014-10-31 14:32 编辑
onlycxb 发表于 2014-10-31 11:15
这个是需要转码的
js本身就具有转此码功能。

终于通过以下函数转码成功(相关链接:http://club.excelhome.net/thread-1159783-33-1.html):
Function UTF8toChineseCharacters(szInput)
    With CreateObject("MSScriptControl.ScriptControl")
    .Language = "JavaScript"
    .AddCode "function decode(str){return unescape(str.replace(/\u/g,'%u'));}"
    UTF8toChineseCharacters = .Eval("decode('" & szInput & "')")
    End With
End Function

Mark如附件:
初识JSON.zip (1.66 MB, 下载次数: 66)

TA的精华主题

TA的得分主题

发表于 2014-10-31 11:54 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
onlycxb 发表于 2014-10-31 11:40

谢谢,通过你的unescape函数,也转码成功!

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-31 11:57 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
VBA万岁 发表于 2014-10-31 11:54
谢谢,通过你的unescape函数,也转码成功!

其实不用转码。看到此类型数据直接放入js中,观察并取得数据即可。

TA的精华主题

TA的得分主题

发表于 2014-10-31 12:14 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 VBA万岁 于 2014-10-31 12:15 编辑
onlycxb 发表于 2014-10-31 11:57
其实不用转码。看到此类型数据直接放入js中,观察并取得数据即可。


转码后看起来直观——由于我这里打不开代码中的网址,所以无法抓包观看responseText数据,只好将其转码后复制到Excel表,从而学习代码。
顺便问一下,抓包时看到的responseText数据应该是已经转码的数据吧?

TA的精华主题

TA的得分主题

发表于 2014-10-31 12:47 | 显示全部楼层
我到这里来一个一个学实例,从第一个例子开始,老师,怎么没有网址呀?代码里的url是fiddler里抓出来的,用这个打开网页再来抓不知道行不行?

TA的精华主题

TA的得分主题

发表于 2014-10-31 13:57 | 显示全部楼层
VBA万岁 发表于 2014-10-31 12:14
转码后看起来直观——由于我这里打不开代码中的网址,所以无法抓包观看responseText数据,只好将其转码 ...

终于可以通过以下方法打开网址了:
打开百度地图:http://map.baidu.com/→在搜索框内填上“北京地铁1号”→单击“百度一下”→单击“地铁1号线”左侧的“详情”。随后对其进行抓包,即可见代码中的网址及responseText数据。
详见稍后更新的75楼附件。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-12 02:50 , Processed in 0.029152 second(s), 6 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表