ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 5097|回复: 19

[求助] 批量下载网页

[复制链接]

TA的精华主题

TA的得分主题

发表于 2014-10-26 16:31 | 显示全部楼层 |阅读模式
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 a4569874 于 2014-10-26 16:38 编辑

麻烦说下这个如何实现VBA批量下载并保存网页,网页的地址以提取到在excel B列中
每次下载都带上伪造的RequestHeader和cookie才能下载

Sub Main()
      Dim strText As String
    With CreateObject("WinHttp.WinHttpRequest.5.1") '
        .Open "GET", "文件地址(B栏)", False
          .setRequestHeader "Accept-Encoding", "identity"
          .setRequestHeader "Cookie","C"
          .setRequestHeader "User-Agent", "Apache-HttpClient/UNAVAILABLE (java 1.4)"
          .Send

          strText = .responsetext
          Debug.Print strText
      End With
End Sub


excel的排布如下表
例子(例子中的下载地址是不需要伪造cookie和RequestHeader)

序号文件地址伪造的cookie栏保存时文件名
1
http://mmsns.qpic.cn/mmsns/DczbRN9ysbnlk6tnJ6RwN2PWIhCXI9lEJRSsR8WG43bJueeX3MJugQ/0伪造的cookie12013-10-11.jpg
2
http://mmsns.qpic.cn/mmsns/DczbRN9ysbnVGORdoy6f0VcjeKYd6W4gqBUiaqftykzicj6ObjWHIl7w/0伪造的cookie22013-10-10.jpg
3
http://mmsns.qpic.cn/mmsns/DczbRN9ysblVV4KbccnLcsmOy4x2HGicLibLIQLeskwdic8ibM1w14e6Iw/0伪造的cookie32013-10-09.jpg
4
http://mmsns.qpic.cn/mmsns/DczbRN9ysbmWfqIIwQUCT1F6A6xLHGuJFbyqjLQowFaxfFY8ANnVaw/0伪造的cookie42013-10-08.jpg
5
http://mmsns.qpic.cn/mmsns/DczbRN9ysblWBUxuehg9A7Q6ibqXvEw3Evf7pRjMQwNoBvwhmcacqIQ/0伪造的cookie52013-10-07.jpg
6
http://mmsns.qpic.cn/mmsns/DczbRN9ysbkAcsXt7Fv9dDyFIpIQBpiasuQ10D8vESLibIvUbrnhIa8w/0伪造的cookie62013-10-06.jpg
有设定代理服务器地址及端口的功能,同时设置每个文件的下载间隔为1秒

先谢谢了

TA的精华主题

TA的得分主题

发表于 2014-10-26 16:39 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
mmsns.qpic.cn
域名是同一个,cookie是相同的,不必换cookie
换 mmsns/ 后面的地址即可

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-26 16:46 | 显示全部楼层
coby001 发表于 2014-10-26 16:39
mmsns.qpic.cn
域名是同一个,cookie是相同的,不必换cookie
换 mmsns/ 后面的地址即可

那个是个excel排布的例子,并非我要下载的真实网页,提取的域名确实一样,但是那个网站有cookie限制,比如一个帐号,一分钟只能浏览十次,超过次数就出错,一分钟后才能正常浏览,因此效率很低,很有必要伪造cookie突破浏览限制

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-26 16:49 | 显示全部楼层
coby001 发表于 2014-10-26 16:39
mmsns.qpic.cn
域名是同一个,cookie是相同的,不必换cookie
换 mmsns/ 后面的地址即可

有时候一分钟浏览超过十次后直接给出错误数据,因此很有必要伪造cookie突破次数阀值限制,问下大神这样的VBA代码怎么实现,多谢了

TA的精华主题

TA的得分主题

发表于 2014-10-26 16:54 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
a4569874 发表于 2014-10-26 16:49
有时候一分钟浏览超过十次后直接给出错误数据,因此很有必要伪造cookie突破次数阀值限制,问下大神这样的VB ...

注册多个帐号。。。。。。。

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-26 16:57 | 显示全部楼层
coby001 发表于 2014-10-26 16:54
注册多个帐号。。。。。。。

恩,如何通过多帐号的cookie按照上面的excel排布批量下载?麻烦大神弄个VBA,先谢谢了

TA的精华主题

TA的得分主题

发表于 2014-10-26 17:19 | 显示全部楼层
a4569874 发表于 2014-10-26 16:57
恩,如何通过多帐号的cookie按照上面的excel排布批量下载?麻烦大神弄个VBA,先谢谢了

用一个xmlhttp 类型的数组

dim xhrArr() as XMLHTTP
或者
dim xhrArr() as WinHttpRequest

Redim xhrArr(1 to 帐号个数) '有几个帐号就定义几个

每个xhrArr() 元素保持一个帐号的会话,cookie也各自不同。

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-26 17:30 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
coby001 发表于 2014-10-26 17:19
用一个xmlhttp 类型的数组

dim xhrArr() as XMLHTTP

刚接触VBA,很深奥,能否按照直接按照上面的excel排布和功能需求(每个文件的下载间隔为1秒,有设定代理服务器地址及端口的功能,和setRequestHeader)直接给个VBA批量下载的代码?

TA的精华主题

TA的得分主题

 楼主| 发表于 2014-10-26 17:32 | 显示全部楼层
coby001 发表于 2014-10-26 17:19
用一个xmlhttp 类型的数组

dim xhrArr() as XMLHTTP

和这里的功能类似http://club.excelhome.net/thread-1062290-1-1.html ,就是下载文件的时候把怎么伪造的setRequestHeader带上一起发送,

TA的精华主题

TA的得分主题

发表于 2014-10-26 17:52 | 显示全部楼层
本帖最后由 coby001 于 2014-10-26 18:09 编辑

Sub AJAX_test()
    Dim xhrArr() As XMLHTTP, vArrRspBody(), byteArr() As Byte   
    ReDim xhrArr(10)   
    ReDim vArrRspBody(10)

    Dim i&
    For i = 0 To 10
        Set xhrArr(i) = New XMLHTTP
        With xhrArr(i)
            .Open "GET", "http://www.baidu.com", False    ', bstrUser, bstrPassword
            .Send           
            byteArr = .ResponseBody  ' .ResponseText
            vArrRspBody(i) = byteArr
            Erase byteArr
        End With
    Next
End Sub


-----
示例~~
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-7-5 19:31 , Processed in 0.047115 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表