ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: wcymiss

[原创] 不懂html也来学网抓(xmlhttp/winhttp+fiddler)

    [复制链接]

TA的精华主题

TA的得分主题

发表于 2015-1-8 12:53 | 显示全部楼层
本帖已被收录到知识树中,索引项:网页交互
请教http://www.dq123.com/price/ 中价格列表数据怎么抓取,他的post网址是变动的

点评

我不是回复你了么。其余知识点自己看帖学就行了。  发表于 2015-1-8 13:05

TA的精华主题

TA的得分主题

发表于 2015-1-8 13:11 | 显示全部楼层
能详细讲讲么?我按列表选型查看时,翻到第二页 raw 信息是这样的:
POST http://www.dq123.com/price/getpricelistjson.php?t=1420693536544 HTTP/1.1
Host: www.dq123.com
Connection: keep-alive
Content-Length: 81
Accept: application/json, text/javascript, */*; q=0.01
Origin: http://www.dq123.com
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36
Content-Type: application/x-www-form-urlencoded
Referer: http://www.dq123.com/price/
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Cookie: _pk_ref.1.e7c8=%5B%22%22%2C%22%22%2C1420693505%2C%22http%3A%2F%2Fjj.17p0.com%2Fjbd%2Flocation2.php%3Fgxsg_url%3DaHR0cDovL3d3dy5kcTEyMy5jb20v%26rurl%3DaHR0cDovL3d3dy5kcTEyMy5jb20v%22%5D; PHPSESSID=fa6260a145c7a04e9adecff6c7337175; _pk_id.1.e7c8=ab246e000995a5be.1420644852.2.1420693510.1420644860.; _pk_ses.1.e7c8=*

factoryid=&categoryid=&classid=&keywordstr=&modelstr=&pageindex=2&initpagesize=50

翻到第三页:
POST http://www.dq123.com/price/getpricelistjson.php?t=1420693652641 HTTP/1.1
Host: www.dq123.com
Connection: keep-alive
Content-Length: 81
Accept: application/json, text/javascript, */*; q=0.01
Origin: http://www.dq123.com
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36
Content-Type: application/x-www-form-urlencoded
Referer: http://www.dq123.com/price/
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Cookie: _pk_ref.1.e7c8=%5B%22%22%2C%22%22%2C1420693505%2C%22http%3A%2F%2Fjj.17p0.com%2Fjbd%2Flocation2.php%3Fgxsg_url%3DaHR0cDovL3d3dy5kcTEyMy5jb20v%26rurl%3DaHR0cDovL3d3dy5kcTEyMy5jb20v%22%5D; PHPSESSID=fa6260a145c7a04e9adecff6c7337175; _pk_id.1.e7c8=ab246e000995a5be.1420644852.2.1420693510.1420644860.; _pk_ses.1.e7c8=*

factoryid=&categoryid=&classid=&keywordstr=&modelstr=&pageindex=3&initpagesize=50
再回到第二页:
POST http://www.dq123.com/price/getpricelistjson.php?t=1420693693733 HTTP/1.1
Host: www.dq123.com
Connection: keep-alive
Content-Length: 81
Accept: application/json, text/javascript, */*; q=0.01
Origin: http://www.dq123.com
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36
Content-Type: application/x-www-form-urlencoded
Referer: http://www.dq123.com/price/
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8
Cookie: _pk_ref.1.e7c8=%5B%22%22%2C%22%22%2C1420693505%2C%22http%3A%2F%2Fjj.17p0.com%2Fjbd%2Flocation2.php%3Fgxsg_url%3DaHR0cDovL3d3dy5kcTEyMy5jb20v%26rurl%3DaHR0cDovL3d3dy5kcTEyMy5jb20v%22%5D; PHPSESSID=fa6260a145c7a04e9adecff6c7337175; _pk_id.1.e7c8=ab246e000995a5be.1420644852.2.1420693510.1420644860.; _pk_ses.1.e7c8=*

factoryid=&categoryid=&classid=&keywordstr=&modelstr=&pageindex=2&initpagesize=50
其中
http://www.dq123.com/price/getpricelistjson.php?t=后面的数值找不到规律
我想下抓取该网页价格列表 中数据,这个网页翻页,浏览器中的网址是不变的。


点评

原来你要按“列表选型”查看价格。说清楚啊。这个就更简单了。t值是个时间值,你的代码里不用把它写上。其实我帖子里说过这个时间值的问题。。。你还是看看帖吧。  发表于 2015-1-8 13:44

TA的精华主题

TA的得分主题

发表于 2015-1-8 15:18 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
ciwei99 发表于 2015-1-8 13:11
能详细讲讲么?我按列表选型查看时,翻到第二页 raw 信息是这样的:
POST http://www.dq123.com/price/get ...

几楼啊 没找到

TA的精华主题

TA的得分主题

发表于 2015-1-8 15:30 | 显示全部楼层
还有我的POST  中网址怎么填充呢??

TA的精华主题

TA的得分主题

发表于 2015-1-8 16:06 | 显示全部楼层
wcymiss 发表于 2014-10-27 14:05
JSON转换成vba对象

1、JSON数组在vba内需要用For Each来获取其元素:(For Each 后面的变量不能定义为Ob ...

从本课开始补课。

TA的精华主题

TA的得分主题

发表于 2015-1-9 08:46 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2015-1-9 09:24 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2015-1-9 16:50 | 显示全部楼层
看了半天没看懂 ,就想问下http://www.dq123.com/price/getpricelistjson.php?t=?  这个?怎么获取

TA的精华主题

TA的得分主题

发表于 2015-1-10 11:04 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
onlycxb 发表于 2015-1-9 08:46
终于登上680楼。

请好,你的教程太好了,给了我很大帮助,但是JOSN这块还是不太会实际应用,能问下http://www.dq123.com/price/getpricelistjson.php?t=?  这个?怎么获取,或者帮忙分析下这个网站价格列表的网抓过程

TA的精华主题

TA的得分主题

发表于 2015-1-11 10:11 | 显示全部楼层
女神大师,求教:http://quote.eastmoney.com/center/list.html#285002_4这个网页的数据如何导入到EXCLE中,如果能帮我写出代码,万分感谢!
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-7-5 17:03 , Processed in 0.043991 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表