ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: xdwy81129

[求助] 【求教】简单抓包代码失败求指点??

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-3-16 21:57 | 显示全部楼层
我用的是比较新版的Firefox,按F12进入控制台模式,
然后选择网络标签栏,按F5刷新.
对于Html网页,有响应一栏可以看到内容.
右键有一个 复制到Curl
然后去下载一个Curl工具,或者你能够看懂复制到Curl的内容,也可以,无非就是请求头等一系列参数.

等你可以下载了,回头凑一下参数,真不是难事.

TA的精华主题

TA的得分主题

发表于 2019-3-16 23:43 | 显示全部楼层
本帖最后由 duquancai 于 2019-3-17 14:21 编辑
xdwy81129 发表于 2019-3-15 11:33
大神,
我把代码复制到电子表格里面了
用不了,这个好像不是vb语言吧,我希望的是用电子表格来解决
  1. # -*- coding: utf-8 -*-
  2. # version: Python 3.7.0
  3. import requests

  4. headers = {
  5.     'User-Agent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
  6.     'Cookie': 'CeRaHigh=d87129f59116fbe163c7ba6a6510f1d1'
  7. }

  8. url = 'https://www.km28.com/lottery-gp/shssl/2019-03-06.html'

  9. r = requests.get(url=url, headers=headers)

  10. print(r.content.decode('utf-8'))
复制代码


TA的精华主题

TA的得分主题

 楼主| 发表于 2019-3-17 17:20 | 显示全部楼层
samsinn 发表于 2019-3-16 20:30
请看附件,VBA POST

感谢大神赐教

我详细学习了大神的代码,如图:
YY.JPG

没有想到原来这个网站如此复杂(我能抓到其他的网站的数据)

但不知道怎么,大神的代码数据是抓到了,但唯独没有我需要的数据,所以不知道问题是什么
大神代码执行后如图:
zz1.JPG

自己抓包软件抓的数据如图:
zz2.JPG


对比以后发现,代码执行得到的数据:<td>里面需要是数据没有,其他的剩余数据全部由。

学习了大神代码,第一次知道Set oWindow = HTML.parentWindow,用模拟方式求cookie,可惜论坛没有这样的贴心学习。我学习了2个抓包帖子

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-3-17 17:22 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
江南新绿 发表于 2019-3-16 21:57
我用的是比较新版的Firefox,按F12进入控制台模式,
然后选择网络标签栏,按F5刷新.
对于Html网页,有响应一 ...

我能提取到其他网站是数据,确实不是什么难事,不过这个网站是数据,经过二个大神的回复以后知道了,另外这个网站的提取是非常非常复杂的。

真不是你想象的这么简单,一开始我同你一样也认为简单,后面才知道厉害。

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-3-17 17:27 | 显示全部楼层
duquancai 发表于 2019-3-14 20:22
输出结果如下:
期号 时间 开奖号码
01 10:30 0 6 3

谢谢大神赐教

我安装了python3.7,运行了代码,可是cmd窗口一闪而过,都不明白输出的结果在哪里??
捕获.JPG

TA的精华主题

TA的得分主题

发表于 2019-3-17 19:26 | 显示全部楼层
xdwy81129 发表于 2019-3-17 17:20
感谢大神赐教

我详细学习了大神的代码,如图:

debug print到立即窗口有时无法显示完整的源码内容,你可以调用剪切板功能读取内容,然后复制粘贴到记事本里查看

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-3-17 20:16 | 显示全部楼层
samsinn 发表于 2019-3-17 19:26
debug print到立即窗口有时无法显示完整的源码内容,你可以调用剪切板功能读取内容,然后复制粘贴到记事 ...

天,真是神人,这个都知道,确实是这样,太佩服了。都不知道怎么说。

TA的精华主题

TA的得分主题

发表于 2019-3-17 21:03 | 显示全部楼层
xdwy81129 发表于 2019-3-17 17:22
我能提取到其他网站是数据,确实不是什么难事,不过这个网站是数据,经过二个大神的回复以后知道了,另外 ...

最多不就模仿一下,tcp/ip协议的三次握手
1次,客户端访问服务器端
2次,服务器端发给你一个通行证
3次,你拿了通行证再次访问服务器,服务器通过检查。放行。
其中,服务器的检查通常有,你是什么浏览器啦,我刚刚给你的是什么cookies等等,这些个都包含在请求头里面

回到python写的答案,不就比你多这个吗?你自己加上请求头即可。
selenium的代码隐含cookies,vb版本是用driver.manage.Cookies可以得到cookies,python版本是driver.manage().getCookies();
copy到curl里面也是很详细的。

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-26 04:52 , Processed in 0.032551 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表