ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 2989|回复: 15

[求助] 网抓问题,无法获取 cookie

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-6-18 23:05 | 显示全部楼层 |阅读模式

下图是 Fiddler Post发送时的截图,公司内网的一个系统,把一些公司敏感标识去掉了,
这个请求发送之后,会收到包含 set Cookie 的 header,我需要用收到的 cookie 来进行后面的操作,
但是不太会模拟这个请求,尝试过用 document.cookie,结果返回空,
请老师指点一下


无标题.jpg

TA的精华主题

TA的得分主题

发表于 2019-6-19 10:10 来自手机 | 显示全部楼层
内网需要内部解决。外网的话,提供初始URL并确认具体需求。

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-6-19 11:05 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
duquancai 发表于 2019-6-19 10:10
内网需要内部解决。外网的话,提供初始URL并确认具体需求。

是公司内网的一个系统,利用网页登录一个 由 java 编写的 sun.applet 内嵌程序,我百度了一下,这种 applet无法独立运行,需要借助网页才能运行,每次登录的时候,会自动下载到用户本地,上面放的截图,就是那个applet在输入完账号密码,登录的时候,fiddler的发包信息。

图中最下面 post相关的信息,好像是乱码,我第一次接触这种 post 信息,他发送之后,接收到的 response信息中包含的cookie,是后面步骤所需要的。
请问能提供一些思路吗,希望能指点一下。

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-6-19 15:39 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
自己顶一下,像这种 post 数据中包含类似乱码的情况,如果有哪位老师知道如何处理,请提示一下,指点一下思路,谢谢

TA的精华主题

TA的得分主题

发表于 2019-6-19 16:30 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-6-24 20:54 | 显示全部楼层
自己顶一下
虽然是个内网的东西,但是我觉得这可能也是网抓中的一个典型例题,能力有限,不知道如何处理这类内容,还希望能有老师指点一下思路,
登录的网页是一个 sun.applet 制作的内嵌程序
Content_Type: application/octet stream
Post 信息中包含加密信息

TA的精华主题

TA的得分主题

发表于 2019-6-24 21:29 | 显示全部楼层
615769472 发表于 2019-6-24 20:54
自己顶一下
虽然是个内网的东西,但是我觉得这可能也是网抓中的一个典型例题,能力有限,不知道如何处理这 ...


内网的,建议:谁写的网页你找谁呀,这锅我不背

TA的精华主题

TA的得分主题

发表于 2019-6-25 05:24 来自手机 | 显示全部楼层
615769472 发表于 2019-6-24 20:54
自己顶一下
虽然是个内网的东西,但是我觉得这可能也是网抓中的一个典型例题,能力有限,不知道如何处理这 ...

Java一般都是加密的,如有确有需求,可以和领导联系,看看能否开放后端web接口,这样子摸索难度比较大。如果是自动化,也可以结合按键精灵之类的外挂程序。

TA的精华主题

TA的得分主题

发表于 2019-6-25 08:34 | 显示全部楼层
实在不行,用VBA控制IE去登陆,然后完成后面的数据抓取工作就行了

TA的精华主题

TA的得分主题

发表于 2019-6-25 09:36 | 显示全部楼层
你抓包登录那一步的数据,然后用XMLHTTP去写一次登录,例子是http://club.excelhome.net/forum. ... p;page=1#pid9984745,登录上去后cookie就能自动同步了,你的报文头就不用写cookie这一句了,还可以继续下面的操作
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-26 09:32 , Processed in 0.047828 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表