ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1695|回复: 18

【求助】VBA网抓的问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2021-2-10 22:27 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
http://www.cwl.gov.cn/cwl_admin/kjxx/findDrawNotice?name=ssq&issueCount=30这个链接Fiddler嗅探出来是有内容的[图1],但是复制到浏览器地址拦访问却是一片空白,所以VBA也不能抓取,需要用什么特殊的方式访问吗?
另一个我成功抓取并用正则处理好了[图2]
  1. Sub wzdltkj()
  2.     Dim myHTTP As Object, s As String
  3.    
  4.     Set myHTTP = CreateObject("Microsoft.XmlHttp")
  5.     myHTTP.Open "GET", "https://webapi.sporttery.cn/gateway/lottery/getHistoryPageListV1.qry?gameNo=85&provinceId=0&pageSize=30&isVerify=1&pageNo=1&termLimits=30", False
  6.     myHTTP.send
  7.    
  8.     s = myHTTP.responsetext
  9.    
  10.     Dim regex As Object, mches As Object, mch As Object, i&, j&

  11.     Set regex = CreateObject("VBScript.Regexp")
  12.     regex.Global = True
  13.     regex.Pattern = "lotteryDrawNum"":""(\d+?)"",""lotteryDrawResult"":""(\d\d) (\d\d) (\d\d) (\d\d) (\d\d) (\d\d) (\d\d).*?""lotteryDrawTime"":""(\d+-\d+-\d+).*?""stakeAmount"":""([\d|,]+).*?""stakeAmount"":""([\d|,]+).*?""stakeAmount"":""([\d|,]+).*?""stakeAmount"":""([\d|,]+)"
  14.    
  15.     Set mches = regex.Execute(s)
  16.    
  17.     i = 2
  18.     For Each mch In mches
  19.         For j = 0 To 12
  20.             Sheet3.Cells(i, j + 1) = mch.submatches(j)
  21.         Next j
  22.         i = i + 1
  23.     Next mch
  24. End Sub
复制代码


Fiddler

Fiddler

正则处理后

正则处理后

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-2-10 22:33 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
我基础不太好,搞了一下午到现在实在没办法,换了个网址抓取成功了。
但还是想知道为什么上面那个json网址为什么不行,求大佬解惑,感激不尽!
3.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-2-11 09:15 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2021-2-11 09:33 | 显示全部楼层
那个网址已经解析出来了,只是混淆了一些其他字符,你用拆分代码提取出来就好了,用正则的话要改规则,比较麻烦,直接提取简单一点

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-2-11 09:36 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
约定的童话 发表于 2021-2-11 09:33
那个网址已经解析出来了,只是混淆了一些其他字符,你用拆分代码提取出来就好了,用正则的话要改规则,比较 ...

大佬能说得具体一点吗?是要把链接里面的字符删除一些?

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-2-11 09:38 | 显示全部楼层
约定的童话 发表于 2021-2-11 09:33
那个网址已经解析出来了,只是混淆了一些其他字符,你用拆分代码提取出来就好了,用正则的话要改规则,比较 ...

我这会儿一点链接,浏览器已经有内容了,我再试试!谢谢大佬

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-2-11 09:47 | 显示全部楼层
刚刚发现了,直接粘贴链接到浏览器还是没内容,但是点链接跳转进去就有内容了。
VBA还是抓不到数据。不明白要怎么做了。。

TA的精华主题

TA的得分主题

发表于 2021-2-11 09:52 | 显示全部楼层
389004101 发表于 2021-2-11 09:47
刚刚发现了,直接粘贴链接到浏览器还是没内容,但是点链接跳转进去就有内容了。
VBA还 ...

文件发上来

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-2-11 10:03 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-2-11 10:05 | 显示全部楼层

我把扩展名改了,现在可以了。麻烦您下载了改回.xlsm

3721.zip

204 KB, 下载次数: 5

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-5-2 02:45 , Processed in 0.042981 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表