|
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用 · 内置多项VBA编程加强工具 ★ 免费下载 ★ ★ 使用手册★
本帖最后由 尖椒土豆絲 于 2019-6-9 18:50 编辑
关于VBA网抓的问题
有没有大神有过这种操作的,麻烦给个例子。
本人功力有限,虽然临时突击但也是心有余而力不足。
谢谢啦!
学习了二位老师的帖子自己鼓捣了几天,数据能抓出来了,前提是得用Fiddler找一个可以用的cookie.
有效的cookie一直没能通过代码获取。
我这个网址是需要用户名密码加验证码的,但是我只需要手动登录到网页,然后通过代码获取可用的cookie最后抓取数据即可。
请大神帮忙看看,给点指点。谢谢!
Sub Main1() '终端明细
Dim strText As String, strCookie As String, Pages As String
With CreateObject("WinHttp.WinHttpRequest.5.1")
.Option(6) = False ' 禁止重定向,以获取原网页信息
.Open "POST", "https://shandianbao.chinapnr.com/supm/doLogin", False
.SetRequestHeader "Host", "shandianbao.chinapnr.com"
.SetRequestHeader "Content-Type", "application/x-www-form-urlencoded; charset=UTF-8"
.SetRequestHeader "Referer", "https://shandianbao.chinapnr.com/supm/login"
.Send
strText = .getAllResponseHeaders '获取所有的回应头信息
strCookie = Split(Split(strText, "Set-Cookie: ")(1), ";")(0) '取出Cookie值
Debug.Print strText: Stop '在立即窗口里查看头信息
strText = .responseText
Debug.Print strText
End With
With CreateObject("WinHttp.WinHttpRequest.5.1")
.Open "POST", "https://shandianbao.chinapnr.com/supm/TER101/control", False
.SetRequestHeader "Content-Type", "application/x-www-form-urlencoded;charset=utf-8"
.SetRequestHeader "Referer", "https://shandianbao.chinapnr.com/supm/TER101/index "
.SetRequestHeader "Cookie", strCookie
.Send "yearBatchno=ALL&pageIndex=5"
strText = .responseText
End With
Pages = Split(Split(Split(strText, "下一页")(1), "末页")(0), "'")(3)
Open ThisWorkbook.Path & "\终端明细" & Format(Now, "YYYYMMDD") & ".txt" For Output As #1 '将工作表中的数据写入NewFileName文本文件中
Print #1, "写入时间: " & Format(Now, "YYYY年M月D日-H点M分S秒")
Print #1, "====================================================================="
Print #1, strText
Close #1
End Sub
|
|