ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wcymiss

[原创] 不懂html也来学网抓(xmlhttp/winhttp+fiddler)

    [复制链接]

TA的精华主题

TA的得分主题

发表于 2017-6-7 14:59 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互

url = "http://data.bank.hexun.com/lccp/Jrxp.aspx?col=1&tag=desc&date=2014-10-21&page=2"
请问: 以上的关键链接,是如何找到的?(用httpwatch和fiddler都未直接查得...)

TA的精华主题

TA的得分主题

发表于 2017-6-14 20:50 | 显示全部楼层
wcymiss 发表于 2014-11-9 21:51
是的,有些网页支持把POST里的SendData放在URL后面用&连接作为参数传递,同时请求方式改为"GET"。比如你 ...

这是网站自己实现上面的处理。一般的server都会提供get()方法和post()方法,获取用户请求的get数据和post数据。现在的大多数server还提供query()方法,可以分别从get/post/cookie中查找某一提交的键值,并获取这个用户输入的值,不管它是来自get还是post
有些情况是网站程序员自己封装了一个query方法,查找某一键值先从get数据找,没有的话找post,再找cookie,知道找到为止。

TA的精华主题

TA的得分主题

发表于 2017-6-15 10:50 | 显示全部楼层
楼主您好,如果我要抓取的网站需要登录呢,我有密码,需要的表格是下拉框一个一个选的能不能根据我的一列数据自动选择下拉框的表格抓取数据呢

TA的精华主题

TA的得分主题

发表于 2017-6-16 16:30 | 显示全部楼层
wcymiss 发表于 2014-10-22 11:10
还是Cookie。。。

模拟Cookie的宗旨是向服务器发送一个它认可的Cookie。不管这个Cookie是回话Cookie还是 ...

非常感谢吴姐循序渐进和耐心的讲解,教程写的太好了。
关于这个例子,有几点建议和思考,还请多批评指正:
一、将fiddler抓到的请求头中的cookie字符串,粘贴到单元格中。在vba的cookie设置中取单元格的value即可。
二、将cookie字符串通过split存为数组,然后逐一去掉,看哪个元素去掉不影响抓包结果,就逐个去掉,最后保留关键的cookie元素。

TA的精华主题

TA的得分主题

发表于 2017-6-20 15:59 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-6-22 07:55 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-6-22 09:20 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2017-6-27 16:48 | 显示全部楼层
wcymiss 发表于 2014-10-21 21:55
获取数据-防盗链的处理-模拟Cookie:

再次提醒,抓包前请先清除浏览器所有Cookie、缓存、历史数据。

吴姐,微信有些链接限于在微信浏览器才打得开
如果用电脑打开,会显示“请在微信客户端打开链接
介于此类问题有解决办法吗?能否给些建议

TA的精华主题

TA的得分主题

发表于 2017-7-11 10:12 | 显示全部楼层
老师好
您提供的一个例题的网址,很多已经失效了,能不能在提供一些新鲜的试题呢?
谢谢你

TA的精华主题

TA的得分主题

发表于 2017-7-13 14:00 | 显示全部楼层
wcymiss 发表于 2014-10-23 12:13
说到skey和bkn,索性再唠叨一下用IE获取Cookie的例子。

QQ的skey用winhttp比较难以获取,当中包含了一些 ...

这个没用fiddler法啊,看不懂
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-24 07:47 , Processed in 0.041567 second(s), 5 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表