ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: liucqa

[分享] 【感谢加精】网页采集教程第五课-如何伪造Cookie及处理Referer防盗链

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2013-12-24 14:07 | 显示全部楼层
liucqa 发表于 2013-12-24 11:41
如果服务器返回的是gzip的话,你得自己写程序解码,具体百度就行

已经搞好了,哈哈。。。。
非常感谢你的耐心。。。。

居然是个很简单的方法,去掉那一句不行,但赋值一个空格就行了。
如果只是“”,会报错,空格就没错了。
setRequestHeader "Accept-Encoding"," "

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-12-24 14:45 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
messias 发表于 2013-12-24 14:01
关键我不知道出现乱码是否就是gzip的原因,用xmlhttp就没有乱码。。。。

你看我发来的响应头文件,能判 ...

看返回的body,gzip有头标记,百度一下就知道了

TA的精华主题

TA的得分主题

发表于 2013-12-24 15:07 | 显示全部楼层
liucqa 发表于 2013-12-24 14:45
看返回的body,gzip有头标记,百度一下就知道了

谢谢楼主耐心解答,有空我会常来。。。。

TA的精华主题

TA的得分主题

发表于 2013-12-24 17:29 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
liucqa 发表于 2013-12-24 11:41
如果服务器返回的是gzip的话,你得自己写程序解码,具体百度就行

已经调试成功,再次过来表示感谢!{:soso_e113:}{:soso_e179:}{:soso_e181:}

TA的精华主题

TA的得分主题

发表于 2014-5-24 16:56 | 显示全部楼层
本帖最后由 messias 于 2014-5-25 18:47 编辑

楼主,又来麻烦你了。。。。。
以前一个网站很容易post登录,最近用vb写了个登录,结果登陆不上了,找不到原因。
抓包分析,帐号用的ansi(gb2312)编码,密码是一串16进制字符................,我感觉是不是网站对密码换了编码方式了(以前登陆我对密码未作处理,因为都是字母加数字)。望楼主抽空回复。。。。。

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-5-24 17:23 | 显示全部楼层
messias 发表于 2014-5-24 16:56
楼主,又来麻烦你了。。。。。
以前一个网站很容易post登录,最近用vb写了个登录,结果登陆不上了,找不到 ...

ansi是一个汉字两字节,utf8是三个字节居多,你数数就知道了

TA的精华主题

TA的得分主题

发表于 2014-5-24 19:07 | 显示全部楼层
本帖最后由 messias 于 2014-5-24 19:10 编辑
liucqa 发表于 2014-5-24 17:23
ansi是一个汉字两字节,utf8是三个字节居多,你数数就知道了

我的密码13个字符,但这个32个字符,所以我就懵了........我的密码就是13个字母加数字,没有汉字.......

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-5-24 21:01 | 显示全部楼层
本帖最后由 liucqa 于 2014-5-25 01:48 编辑
messias 发表于 2014-5-24 19:07
我的密码13个字符,但这个32个字符,所以我就懵了........我的密码就是13个字母加数字,没有汉字.......

捕获.JPG

MD5的32位哈希值


所以说,搞网页采集,有个好工具是多么的重要了


其实你直接发抓包出来的内容就行,不需要关心用户名和密码是什么,反正网站能识别就行。

除非,你有好多用户名和密码要发包,那就得自己做一下密码的MD5哈希值计算了,论坛有代码。







TA的精华主题

TA的得分主题

发表于 2014-5-24 22:57 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 messias 于 2014-5-25 18:46 编辑
liucqa 发表于 2014-5-24 21:01
所以说,搞网页采集,有个好工具是多么的重要了

楼主,你这个工具,我不太懂,应该是个各编码互相转换的工具吧,印象里见过。
我的理解是这一串16进制字符串不符合base32规范,也可能我的理解是错的。。。。
这样吧,我也不遮着掩着了,其实这是我某网站版主帐号,所以比较小心,见谅。。。。。
我通过ie实际登录再抓包,得到post内容...............

................就是.............的ansi(gb2312)编码;
这串字符感觉是把密码通过某过程编码为16进制字符串,当然这只是我的感觉,现在摸不着头脑,望楼主指教。。。。。

实际上,楼主的这个系列教程,本人看过无数遍,但凡能找到解决问题的蛛丝马迹,就不敢劳烦楼主;
为了不遗漏任何一种可能,教程里的所有链接,我都仔细看过,获益良多,感谢楼主!

点评

请及时修改你的密码,虽然那个版块也没啥看头,但公开总是有隐患的。密码是MD5加密的,看楼上内容。  发表于 2014-5-25 01:41

TA的精华主题

TA的得分主题

发表于 2014-5-25 18:13 | 显示全部楼层
本帖最后由 messias 于 2014-5-25 18:51 编辑
liucqa 发表于 2014-5-24 21:01
MD5的32位哈希值

哦,非常感谢搂主的耐心回复!

有时候人脑子就是没转过来,呵呵.....我也查到了这个就是md5的加密,你说得没错为啥不直接复制了用就拉倒。。。。因为这个程序写的是为了别的用处,md5的事情还是需要搞定的,我已经找到了可用的模块,也测试正确。对了,你如何知道我是那个板快的?

好吧,关于帐号密码的内容都删了,密码也改了.
其实,就像你说的,那个板快看的人不多.如果是小号,我也懒得管,但毕竟是版主的帐号,咱不能害了那个论坛.谢谢楼主提醒!

点评

百度大神的威力是无穷的...  发表于 2014-5-25 20:41
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-22 02:13 , Processed in 0.039446 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表