ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wcymiss

[原创] 不懂html也来学网抓(xmlhttp/winhttp+fiddler)

    [复制链接]

TA的精华主题

TA的得分主题

发表于 2015-2-15 13:47 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互
oliverpep 发表于 2015-2-13 14:26
吴老师,您的贴子太赞了,为我打开了web操作类编程又一思路。我以前总使用浏览器模拟的方式来实现网络 ...

吴老师,对不起,我没有表达清楚意思,我是想怎么样能得到如你贴子中的
"http://club.excelhome.net/forum.php?mod=attachment&aid=MTA2MjQ1MHw0MDQxMTAzOHwxNDE0MTIxNTg0fDIxODkxN3w4MDk5MjQ%3D"
的地址

点评

在fiddler里面查看啊。  发表于 2015-2-15 16:26

TA的精华主题

TA的得分主题

发表于 2015-2-15 16:38 | 显示全部楼层
oliverpep 发表于 2015-2-15 13:47
吴老师,对不起,我没有表达清楚意思,我是想怎么样能得到如你贴子中的
"http://club.excelhome.net/for ...

吴老师,我意思是如何从fiddler中分析出下载地址并自动生成,能不能给个思路或者实例,因为下载地址没办法直接用find来检索到(这方面我是小白,老师别见笑)

TA的精华主题

TA的得分主题

发表于 2015-2-16 15:25 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-2-17 10:35 | 显示全部楼层
oliverpep 发表于 2015-2-15 13:47
吴老师,对不起,我没有表达清楚意思,我是想怎么样能得到如你贴子中的
"http://club.excelhome.net/for ...

先上传一个测试文档:

test.rar

104 Bytes, 下载次数: 50

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-2-17 10:48 | 显示全部楼层
本帖最后由 wcymiss 于 2015-2-17 10:49 编辑
oliverpep 发表于 2015-2-15 16:38
吴老师,我意思是如何从fiddler中分析出下载地址并自动生成,能不能给个思路或者实例,因为下载地址没办法 ...


获取上贴的文件的下载地址的过程如下:

1、登录excelhome
2、打开fiddler
3、输入网址:http:/ /club.excelhome.net/forum.php?mod=viewthread&tid=1159783&page=71,抓包
4、抓包完毕后,在fiddler里搜索字符串:“先上传一个测试文档”
5、如下图,可以看到下载文档的地址在responsetext里。
获取下载文档的链接.png

TA的精华主题

TA的得分主题

发表于 2015-2-17 19:00 | 显示全部楼层
wcymiss 发表于 2015-2-17 10:48
获取上贴的文件的下载地址的过程如下:

1、登录excelhome

十分感谢,我会顺着这个思路研究的。在这佳节即将来临之际,先预祝吴老师新春快乐,万事如意。

TA的精华主题

TA的得分主题

发表于 2015-2-20 20:56 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2015-3-5 11:05 | 显示全部楼层
超有帮助…
太感动了,终于成功抓到我们公司的网页资料了,
每次登入后,他会发给你一个jsessionid,
这个Jessionid我都无法在cookie中找到,所以卡好久…
但是在reponse的页面就有了,所以直接取用
然后取得这个jsessionid后,后面的网址都是一样的变化,唯一不同的是要用刚取得的Jsessionid
不然会出现登入错误

然后就有很多选择,每选一个,就POST一次

直到POSt n次后,
就有资料了…

真的太感谢这篇文章了…
不过没有基础,感觉就不踏实…

点评

http对象从服务器获得的reponse的内容里如果有cookie信息,在同一个http对象下,下一次post或get,不需要setrequest "cookie",也可以自动向服务器发送cookie消息。  发表于 2015-3-5 11:50

TA的精华主题

TA的得分主题

发表于 2015-3-5 12:00 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
楼主讲解的好细!一定要顶!!可是看来好难学的样子呢

TA的精华主题

TA的得分主题

发表于 2015-3-5 12:31 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 lolmuta 于 2015-3-5 12:38 编辑
lolmuta 发表于 2015-3-5 11:05
超有帮助…
太感动了,终于成功抓到我们公司的网页资料了,
每次登入后,他会发给你一个jsessionid,

jsessionid是在url里面如

www.aaa.com.xx;jsessionid=123123123123

每一个要post 的url虽都不同,但相同都是jsessionid=123123123123

将评点的话消化如下

服务器肯定是认jsessionid的,不然他怎么知道你之前的选择是什么
要记得是一堆人在使用的啊…

当你在登入时,服务器内就产生一个jsessionid给你,但是完全不用设定在cookie中

其实一开始就已经将jsessionid写入到你目前的页面中,可以是按钮,可以是checkbox…反正有要进行post动作的地方,都安置了jsessionid 在里面
所以才可以当我每操作一个动作时,url都有变,但是不变的就是jsessionid=123123123123,

每一个动作后,因为服务器有接收到你的jsessionid, 所以可以合理的认定产生的新的页面也都继续藏着这个jsessionid,
所以这个jsessionid会一直阴魂不散的跟着你走…


http对象从服务器获得的reponse的内容里如果有cookie信息(将jsessionid藏到有post动作的地方)
在同一个http对象下,下一次post或get,
不需要setrequest "cookie"(不用靠cookie,因为不需要靠cookie来存放jsessionid,jsessionid是存在你目前的页面上)
)也可以自动向服务器发送cookie(发送jsessionid,因为你当前页面所有的post动作,都已经写入jsessionid了)


您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-25 14:50 , Processed in 0.045635 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表