ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 4741|回复: 22

[求助] 连续抓取全国建筑市场监管公共服务平台企业注册人员

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-5-29 19:21 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
全国建筑市场监管公共服务平台中企业注册人员有多页,如何抓取全部数据?

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-5-29 19:23 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-5-29 19:49 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-5-29 20:58 | 显示全部楼层
719404338 发表于 2019-5-29 19:49
http://jzsc.mohurd.gov.cn/dataservice/query/staff/list  这个不难。

Sub Main()
    Dim strText As String
    With CreateObject("WinHttp.WinHttpRequest.5.1")
        .Open "POST", "http://jzsc.mohurd.gov.cn/dataservice/query/comp/list, False"

'        .setRequestHeader "Host", "jzsc.mohurd.gov.CN"
'        .setRequestHeader "Upgrade-Insecure-Requests", "1"
'        .setRequestHeader "Connection", "keep-alive"
'        .setRequestHeader "Origin", "http://jzsc.mohurd.gov.cn"
        .setRequestHeader "Cookie", "__guid=180692732.2390543291493264400.1559129120610.8428; Hm_lvt_b1b4b9ea61b6f1627192160766a9c55c=1559129111,1559129138,1559129191; JSESSIONID=8F546285962D7762CFA18C447F779269; monitor_count=13; Hm_lpvt_b1b4b9ea61b6f1627192160766a9c55c=1559133635"
'        .setRequestHeader "User-Agent", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"
        .setRequestHeader "Content-Type", "text/html;charset=utf-8"
'        .setRequestHeader "Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8"""
        .setRequestHeader "Referer", "http://jzsc.mohurd.gov.cn/dataservice/query/comp/list"
'        .setRequestHeader "Content-Language", "zh-CN"
'        .setRequestHeader "Content-Length", "46"
        .send "%24total=359384&%24reload=0&%24pg=2&%24pgsz=15"

        strText = .responsetext
        Debug.Print strText
        Stop
    End With
End Sub


模拟了好多头信息,都抓不到,能请教下嘛?

TA的精华主题

TA的得分主题

发表于 2019-5-29 21:27 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-5-29 22:50 | 显示全部楼层
719404338 发表于 2019-5-29 19:49
http://jzsc.mohurd.gov.cn/dataservice/query/staff/list  这个不难。

多页如何获取?请指教!

TA的精华主题

TA的得分主题

发表于 2019-5-29 22:57 | 显示全部楼层
719404338 发表于 2019-5-29 19:49
http://jzsc.mohurd.gov.cn/dataservice/query/staff/list  这个不难。

那就增加点难度,把中间缺失的号码补齐

TA的精华主题

TA的得分主题

发表于 2019-5-30 05:29 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册

TA的精华主题

TA的得分主题

发表于 2019-5-30 06:34 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-5-30 07:47 | 显示全部楼层
liangdinghu 发表于 2019-5-29 20:58
Sub Main()
    Dim strText As String
    With CreateObject("WinHttp.WinHttpRequest.5.1")

Sub Main()
    Dim strText As String
    With CreateObject("WinHttp.WinHttpRequest.5.1")'#仔细看看这句!!
        .Open "POST", "http://jzsc.mohurd.gov.cn/dataservice/query/comp/list, False"

'        .setRequestHeader "Host", "jzsc.mohurd.gov.CN"
'        .setRequestHeader "Upgrade-Insecure-Requests", "1"
'        .setRequestHeader "Connection", "keep-alive"
'        .setRequestHeader "Origin", "http://jzsc.mohurd.gov.cn"
        .setRequestHeader "Cookie", "__guid=180692732.2390

评分

1

查看全部评分

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-24 20:44 , Processed in 0.057267 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表