ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3814|回复: 22

[求助] 网抓难题求解!!!

[复制链接]

TA的精华主题

TA的得分主题

发表于 2015-1-5 19:12 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
网页抓取遇到难题
代码如下:
  1. '辽宁站http://gsxt.lngs.gov.cn/saicpub/entPublicitySC/entPublicityDC/searchPub.action
  2. Sub ln()
  3.     Dim objHR As New WinHttp.WinHttpRequest, P
  4.     UserForm1.Show
  5.     With objHR
  6.         .Open "POST", "http://gsxt.lngs.gov.cn/saicpub/entPublicitySC/entPublicityDC/lngsSearchFpc.action?authCode=" & Vcode & "&solrCondition=幸福筑家房地产开发有限公司", False
  7.         .setRequestHeader "Referer", "http://gsxt.lngs.gov.cn/saicpub/entPublicitySC/entPublicityDC/entPublicity/search/searchmain.jsp"
  8.         .setRequestHeader "Content-Type", "application/x-www-form-urlencoded"
  9.         .setRequestHeader "Cookie", "JSESSIONID=WHNxJqhbPpDTSQMGp7n22zt96L0fnfy5pHH67Bd8QSQ2GJT9Mpd2!-1247540927!1668631573; COOKIE=20111157; CNZZDATA1000310629=1520308480-1420445876-http%3A%2F%2Fgsxt.lngs.gov.cn%2F|1420445876"
  10.         .send
  11.         P = .responseText
  12.         With CreateObject("new:{1C3B4210-F441-11CE-B9EA-00AA006B1A69}")  '数据放入剪贴板,记事本观察数据
  13.             .SetText P                                                   
  14.             .PutInClipboard                                             
  15.         End With
  16.     End With
  17. End Sub
复制代码

上述代码中没有得到想要的数据,求指点!完整代码见附件 test.rar (16.69 KB, 下载次数: 17)

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-5 20:54 | 显示全部楼层
自己再顶一下,期待高手

TA的精华主题

TA的得分主题

发表于 2015-1-5 21:09 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-5 21:15 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2015-1-5 21:18 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-5 21:24 | 显示全部楼层
coby001 发表于 2015-1-5 21:18
Fiddler
。。。。。。。。。。。。

POST http://gsxt.lngs.gov.cn/saicpub/ ... earchListFpc.action HTTP/1.1
Host: gsxt.lngs.gov.cn
User-Agent: Mozilla/5.0 (Windows NT 6.1; rv:34.0) Gecko/20100101 Firefox/34.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Referer: http://gsxt.lngs.gov.cn/saicpub/ ... earchListFpc.action
Cookie: CNZZDATA1000310629=1520308480-1420445876-http%253A%252F%252Fgsxt.lngs.gov.cn%252F%7C1420456679; JSESSIONID=7DdnJqMJ6Q2NDLjGMV21sK5lRRGZR0J5HKT3qZLTgTvdHzyf0dr5!1946477291!-1726158255; COOKIE=20111148
Connection: keep-alive
Content-Type: application/x-www-form-urlencoded
Content-Length: 28

authCode=2&solrCondition=aaa
这是我抓取的网址信息,却不知道您是如何得到的正确网址

TA的精华主题

TA的得分主题

发表于 2015-1-5 21:30 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-5 21:43 | 显示全部楼层
coby001 发表于 2015-1-5 21:30
你不够细心呗~
仔细找~~

原来在下一页面
http://gsxt.lngs.gov.cn/saicpub/ ... 400205200007075842X

现在的难点是pripid值的取得,谢谢你

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-5 22:09 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
coby001 发表于 2015-1-5 21:30
你不够细心呗~
仔细找~~

最关键的是,前一个页面的问题还没有解决。这个pripid值在下面的地址反馈页面中有相应的值。这个值现在还是没有办法取出
POST http://gsxt.lngs.gov.cn/saicpub/ ... earchListFpc.action HTTP/1.1
Host: gsxt.lngs.gov.cn
User-Agent: Mozilla/5.0 (Windows NT 6.1; rv:34.0) Gecko/20100101 Firefox/34.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Referer: http://gsxt.lngs.gov.cn/saicpub/ ... earchListFpc.action
Cookie: CNZZDATA1000310629=1520308480-1420445876-http%253A%252F%252Fgsxt.lngs.gov.cn%252F%7C1420462093; JSESSIONID=mxKQJqYf50cMdQQS1Mbch51J9zSmvwyMcns1wMZGJVLWnh217yff!1946477291!-1726158255; COOKIE=20111148
Connection: keep-alive
Content-Type: application/x-www-form-urlencoded
Content-Length: 28

authCode=2&solrCondition=aaa


TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-6 08:05 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-20 09:48 , Processed in 0.047440 second(s), 15 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表