ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 4834|回复: 18

[已解决] 怎么取网页表格上的60000多条数据到EXCEL上?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-8-19 17:05 | 显示全部楼层 |阅读模式
http://szsbzx.jsszhrss.gov.cn:9900/web/website/pubQuery/ypmlQuery.jsp


怎么取网页表格上的60000多条数据到EXCEL上.PNG

TA的精华主题

TA的得分主题

发表于 2018-8-19 18:42 来自手机 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
6W多条,太多了,能不能少点呢?

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-8-19 20:25 | 显示全部楼层
duquancai 发表于 2018-8-19 18:42
6W多条,太多了,能不能少点呢?

取2页、3页均可,要个方法!

TA的精华主题

TA的得分主题

发表于 2018-8-19 20:42 来自手机 | 显示全部楼层
Kil1 发表于 2018-8-19 20:25
取2页、3页均可,要个方法!

我没得方法,怎么给你呢?等后面的大神吧!

TA的精华主题

TA的得分主题

发表于 2018-8-19 20:55 | 显示全部楼层
GIF.gif

用码栈,不到十分钟就能采集到数据,https://codestore.taobao.com/index.htm



TA的精华主题

TA的得分主题

发表于 2018-8-19 21:36 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 duquancai 于 2018-8-19 22:57 编辑

Kil1 发表于 2018-8-19 20:25
取2页、3页均可,要个方法!
  1. Sub main()
  2.     Dim xmlHttp As Object, DOM As Object, strText$, p&, arrData(1 To 70000, 1 To 16), i&, j&, n&
  3.     Set xmlHttp = CreateObject("msxml2.xmlhttp")
  4.     Set DOM = CreateObject("htmlfile")
  5.     For p = 1 To 3 '只搞第3页,共60条数据,别抓多了,够意思就行了!
  6.         With xmlHttp
  7.             .Open "POST", "http://szsbzx.jsszhrss.gov.cn:9900/web/website/pubQuery/pubQueryAction?frameControlSubmitFunction=getPagesAjax", False
  8.             .setRequestHeader "Content-Type", "application/x-www-form-urlencoded"
  9.             .send "querytype=ypml&pageIndex=" & p & "&pageCount=20&sfzf=1"
  10.             strText = .responsetext
  11.         End With
  12.         With DOM
  13.             .body.innerhtml = strText
  14.             For i = IIf(p = 1, 0, 1) To .all.tags("table")(1).Rows.Length - 1
  15.                 n = n + 1
  16.                 For j = 0 To .all.tags("table")(1).Rows(i).Cells.Length - 1
  17.                     arrData(n, j + 1) = Split(.all.tags("table")(1).Rows(i).Cells(j).innerText, "<\/td>")(0)
  18.                 Next
  19.             Next
  20.         End With
  21.     Next
  22.     Cells.Clear
  23.     Range("a1").Resize(n, 16) = arrData
  24. End Sub
复制代码


评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2018-8-19 23:08 | 显示全部楼层
  1. Sub GetData()
  2.     Dim strData$
  3.     Application.ScreenUpdating = False
  4.     Cells.Clear
  5.     With CreateObject("Forms.TextBox.1")
  6.         For i = 1 To 3
  7.             strData = TableStr(i)
  8.             .Text = strData
  9.             .SelStart = 0
  10.             .SelLength = Len(strData)
  11.             .Copy
  12.             If i = 1 Then
  13.                 Range("A1").Select
  14.             Else
  15.                 Range("A65536").End(xlUp).Offset(1).Select
  16.             End If
  17.             ActiveSheet.PasteSpecial
  18.         Next
  19.     End With
  20.     Application.ScreenUpdating = True
  21. End Sub


  22. Function TableStr(ByVal PageIndex As Integer) As String
  23.     Dim Url$, PostData$
  24.     PostData = "querytype=ypml&pageIndex=" & PageIndex & "&pageCount=20&sfcf=&tym=&spm=&sfzf=1"
  25.     Url = "http://szsbzx.jsszhrss.gov.cn:9900/web/website/pubQuery/pubQueryAction?frameControlSubmitFunction=getPagesAjax"
  26.     With CreateObject("MsXml2.Xmlhttp")
  27.         .Open "Post", Url, False
  28.         .setRequestHeader "Content-Type", "application/x-www-form-urlencoded"
  29.         .setRequestHeader "Connection", "keep-alive"
  30.         .send (PostData)
  31.         strreponsetext = .responsetext
  32.         TableStr = Replace("<table" & Split(Split(strreponsetext, "<table")(2), "<\/table>")(0) & "<\/table>", "\t", "")
  33.     End With
  34. End Function
复制代码

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2018-8-19 23:10 | 显示全部楼层
附件参考>>>>>>>>>>>>>>

获取网页数据.rar (17.45 KB, 下载次数: 78)

TA的精华主题

TA的得分主题

发表于 2018-8-19 23:49 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
hau耗子 发表于 2018-8-19 20:55
用码栈,不到十分钟就能采集到数据,https://codestore.taobao.com/index.htm

好哈,大佬,捉到你了,M群里的。耗子哥

TA的精华主题

TA的得分主题

发表于 2018-8-20 08:57 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
用python采集,也就半个小时的事情的,需要联系我
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-23 23:29 , Processed in 0.047697 second(s), 17 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表