ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wcymiss

[原创] 不懂html也来学网抓(xmlhttp/winhttp+fiddler)

    [复制链接]

TA的精华主题

TA的得分主题

发表于 2023-6-15 10:29 来自手机 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互
coby001 发表于 2014-10-27 10:43
因为IE执行了网页中的 js ,而js中有向html 插入 table 。
xmlhttp 不执行 js。
所以,得到的html 结构 ...

就是所谓动态网页吧?

TA的精华主题

TA的得分主题

发表于 2023-7-25 11:50 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
wcymiss 发表于 2014-10-21 21:55
获取数据-防盗链的处理-模拟Cookie:

再次提醒,抓包前请先清除浏览器所有Cookie、缓存、历史数据。

老师,请问下面的代码问题出在哪里呢?数据查询成功,但是没有返回结果。

  1. Sub Main()
  2.     Dim strText As String
  3.     'With CreateObject("MSXML2.XMLHTTP") 'CreateObject("WinHttp.WinHttpRequest.5.1")
  4.     With CreateObject("WinHttp.WinHttpRequest.5.1")
  5.         .Option(6) = False ' 禁止重定向,以获取原网页信息
  6.         .Open "POST", "https://397489.yichafen.com/public/checkcondition/sqcode/NsDcIn5mNDkwM3w4NWYzNmU4YmFlYjc4YjZhNjk2NjMyODJhZjFhNmYxYXwzOTc0ODkO0O0O/htmlType/default.html", False
  7.         .setRequestHeader "Content-Type", "application/x-www-form-urlencoded; charset=UTF-8"
  8.         .setRequestHeader "Referer", "https://397489.yichafen.com/public/queryscore/sqcode/NsDcIn5mNDkwM3w4NWYzNmU4YmFlYjc4YjZhNjk2NjMyODJhZjFhNmYxYXwzOTc0ODkO0O0O.html"
  9.         .Send "s_kaohao=612017584&s_xingming=%E6%9B%BE%E7%A6%B9%E7%9A%93"
  10.         strText = .responsetext
  11.         Debug.Print strText
  12.     End With
  13. End Sub
复制代码
QQ截图20230725114653.png

TA的精华主题

TA的得分主题

发表于 2023-7-25 13:13 | 显示全部楼层
本帖最后由 perfect131 于 2023-7-25 13:20 编辑
shenjianrong163 发表于 2023-7-25 11:50
老师,请问下面的代码问题出在哪里呢?数据查询成功,但是没有返回结果。

分析的不够仔细,需要三次 请求
1.jpg
2.jpg

TA的精华主题

TA的得分主题

发表于 2023-7-25 13:45 | 显示全部楼层
shenjianrong163 发表于 2023-7-25 11:50
老师,请问下面的代码问题出在哪里呢?数据查询成功,但是没有返回结果。

优化版
2.png

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-7-28 10:06 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

老师,您有空时请帮忙看看下面的数据抓取时问题出在哪里,谢谢!

  1. Sub Main()
  2.     Dim strText As String
  3.     With CreateObject("MSXML2.XMLHTTP") 'CreateObject("WinHttp.WinHttpRequest.5.1")
  4.         .Open "POST", "https://developer.amap.com/service/api/restapi?keywords=%E5%B1%B1%E4%B8%9C&subdistrict=3&extensions=base", False
  5.         .setRequestHeader "Content-Type", "application/x-www-form-urlencoded; charset=UTF-8"
  6.         .setRequestHeader "Referer", "https://developer.amap.com/api/webservice/guide/api/district/"
  7.         .Send "type=config%2Fdistrict&version=v3"
  8.         strText = .responsetext
  9.         Debug.Print strText
  10.     End With
  11. End Sub
复制代码
链接:https://developer.amap.com/api/webservice/guide/api/district/
01.png

TA的精华主题

TA的得分主题

发表于 2023-8-7 16:30 | 显示全部楼层
wcymiss 发表于 2014-10-22 12:30
新手作业:

网站:http://weibo.com/guide/welcome

悲催啊,单位电脑,你发的作业基本上都打不开。

TA的精华主题

TA的得分主题

发表于 2023-10-25 10:23 | 显示全部楼层
image.png
网抓的时候出现“安全频道支持出错”,麻烦高手帮忙看看,谢谢了

TA的精华主题

TA的得分主题

发表于 2023-10-27 14:57 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
sskzzm 发表于 2023-10-25 10:23
网抓的时候出现“安全频道支持出错”,麻烦高手帮忙看看,谢谢了

估计是 tls的原因
https://club.excelhome.net/forum ... amp;_dsign=c4e90222

TA的精华主题

TA的得分主题

发表于 2023-10-27 15:05 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2023-11-8 22:01 | 显示全部楼层
wcymiss 发表于 2014-10-21 15:20
新手作业:
网站:http://www.pinble.com/Lottery.htm
操作:点击“各省体彩”---“江苏七星彩”,获取江 ...

请问哪位大神把链接找出来了哇?我只找到http://www.pinble.com/LotteryOneList.aspx?type=59DAE47BC0A467C82C20144B4C19F18E89DA39CC782A9811
但这个连接点进去一片空白
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-14 14:29 , Processed in 0.053512 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表