ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3780|回复: 44

[求助] 求助如何把这个网址中的文档下载下来?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-6-14 11:07 | 显示全部楼层 |阅读模式
http://biaozhun.osta.org.cn/pdfview.html?code=544

非常感谢。

TA的精华主题

TA的得分主题

发表于 2023-6-14 12:51 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
就是要个爬虫代码呗
新建位图图像.jpg

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-6-14 12:53 | 显示全部楼层
Sub autore()
Dim str1 As String
With CreateObject("winhttp.winhttprequest.5.1")
Url = "http://biaozhun.osta.org.cn/api/v1/profession/detail"
.Open "post", Url
.setRequestHeader "Accept", "application/json, text/javascript, */*; q=0.01"
.setRequestHeader "Accept-Language", "zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6"
.setRequestHeader "Content-Type", "application/x-www-form-urlencoded; charset=UTF-8"
.setRequestHeader "Origin", "http://biaozhun.osta.org.cn"
.setRequestHeader "Proxy-Connection", "keep-alive"
.setRequestHeader "Referer", "http://biaozhun.osta.org.cn/pdfview.html?code=544"
.setRequestHeader "User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36 Edg/114.0.1823.43"
.setRequestHeader "X-Requested-With", "XMLHttpRequest"
.setRequestHeader "x-forwarded-for", "1.1.1.1"
.send ("code=544")
str1 = Split(Split(.responsetext, "data"":""")(1), """}")(0)
End With
SaveBinaryDataToFile Base64Decode(str1), "D:\1.pdf"
End Sub
Sub SaveBinaryDataToFile(BinaryData() As Byte, FilePath As String)
    Dim FileHandle As Integer ' 文件句柄
    Dim NumBytesWritten As Long ' 写入字节数
    FileHandle = FreeFile ' 获取一个可用的文件句柄
    Open FilePath For Binary Access Write As #FileHandle ' 以二进制模式打开文件
    Put #FileHandle, , BinaryData ' 将二进制数据写入文件
    Close #FileHandle ' 关闭文件
End Sub

Function Base64Decode(Base64String As String) As Byte()
    Dim Base64XML As Object
    Set Base64XML = CreateObject("MSXML2.DOMDocument.6.0")
    Dim Base64Node As Object
    Set Base64Node = Base64XML.createElement("b64")
    Base64Node.DataType = "bin.base64"
    Base64Node.Text = Base64String
    Dim DecodedByteStream() As Byte
    DecodedByteStream = Base64Node.nodeTypedValue
    Base64Decode = DecodedByteStream

End Function

评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-6-14 13:24 | 显示全部楼层
tspliu 发表于 2023-6-14 12:51
就是要个爬虫代码呗

感谢分享,留名学习

TA的精华主题

TA的得分主题

发表于 2023-6-14 13:39 | 显示全部楼层
需要解密
1.png
无用 RequestHeader可以不要
2.jpg

评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-6-14 14:12 | 显示全部楼层
游乐缘 发表于 2023-6-14 13:24
感谢分享,留名学习

哈哈,不是我写的,ChatGPT写的

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-6-14 14:53 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
tspliu 发表于 2023-6-14 12:51
就是要个爬虫代码呗

是的呀。我也找到这个URL,但是不会解码
能上传个不文档不

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-6-14 14:54 | 显示全部楼层
perfect131 发表于 2023-6-14 13:39
需要解密

无用 RequestHeader可以不要

是的,这个解密代码不会写

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-6-14 14:54 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2023-6-14 15:07 | 显示全部楼层
凑个热闹,发post请求,解析json,base64解码,输出到pdf
  1. curl 'http://biaozhun.osta.org.cn/api/v1/profession/detail' -d 'code=544' -s | jq -r '.data' | base64 -d > a.pdf
复制代码



image.png

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-16 18:10 , Processed in 0.047149 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表