ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1316|回复: 3

多个网页的数据批量提取

[复制链接]

TA的精华主题

TA的得分主题

发表于 2020-1-6 11:46 | 显示全部楼层 |阅读模式
各位论坛的大大,萌新有一个需求,希望各位大大能够指条明路。我的附件有3个sheet,分别是URL,数据表,数据自网站下载的内容。其中URL 是列表就是我需求爬取的网页链接,数据表是我希望最终汇总数据的表格,“数据自网站下载的内容”是我使用EXCEL 自带从网站提取数据提取到的内容,标黄的部分就是数据表要提取的内容。现在我希望能够有一个宏,批量完成此项工作,就不用操作400多次。麻烦各位大大指导,或者能给一个类似的代码我自行修改,万分感谢。

需求表.rar

28.76 KB, 下载次数: 19

需求案例

TA的精华主题

TA的得分主题

发表于 2020-1-6 13:26 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
直接从http://gs.amac.org.cn/amac-infodisc/res/pof/manager/index.html取得数据列表,再利用程序逐个抓取各数据项。人为操作可一次完成,但程序终究还是逐个获取的

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-1-6 15:48 | 显示全部楼层
onlycxb 发表于 2020-1-6 13:26
直接从http://gs.amac.org.cn/amac-infodisc/res/pof/manager/index.html取得数据列表,再利用程序逐个抓取 ...

谢谢您 我也再研究一下,论坛里面有我这样类似的需求,我读了一些代码太复杂了。

TA的精华主题

TA的得分主题

发表于 2020-1-7 16:56 | 显示全部楼层
  1. Sub getifo()
  2. Dim str As String
  3. Dim t
  4. t = Timer
  5. For m = 2 To Sheets("URL").Range("A1048576").End(xlUp).Row
  6. URL = Sheets("URL").Cells(m, 1)
  7. With CreateObject("internetexplorer.application")
  8. .Navigate URL
  9. While .busy Or .readystate <> 4: Wend
  10. On Error Resume Next
  11. Sheets("数据表").Cells(m, "A") = .Document.getElementsByTagName("TD")(2405).innertext
  12. Sheets("数据表").Cells(m, "B") = .Document.getElementsByTagName("TD")(2407).innertext
  13. Sheets("数据表").Cells(m, "C") = .Document.getElementsByTagName("TD")(2409).innertext
  14. Sheets("数据表").Cells(m, "D") = .Document.getElementsByTagName("TD")(2411).innertext
  15. Sheets("数据表").Cells(m, "E") = .Document.getElementsByTagName("TD")(2413).innertext
  16. Sheets("数据表").Cells(m, "F") = .Document.getElementsByTagName("TD")(2415).innertext
  17. Sheets("数据表").Cells(m, "G") = .Document.getElementsByTagName("TD")(2417).innertext
  18. Sheets("数据表").Cells(m, "H") = .Document.getElementsByTagName("TD")(2419).innertext
  19. Sheets("数据表").Cells(m, "I") = .Document.getElementsByTagName("TD")(2421).innertext
  20. Sheets("数据表").Cells(m, "J") = .Document.getElementsByTagName("TD")(2423).innertext
  21. Sheets("数据表").Cells(m, "K") = .Document.getElementsByTagName("TD")(2425).innertext
  22. Sheets("数据表").Cells(m, "L") = .Document.getElementsByTagName("TD")(2427).innertext
  23. Sheets("数据表").Cells(m, "M") = .Document.getElementsByTagName("TD")(2429).innertext
  24. Sheets("数据表").Cells(m, "N") = .Document.getElementsByTagName("TD")(2431).innertext
  25. Sheets("数据表").Cells(m, "O") = .Document.getElementsByTagName("TD")(2433).innertext
  26. Sheets("数据表").Cells(m, "P") = .Document.getElementsByTagName("TD")(2435).innertext
  27. Sheets("数据表").Cells(m, "Q") = .Document.getElementsByTagName("TD")(2437).innertext
  28. Sheets("数据表").Cells(m, "R") = .Document.getElementsByTagName("TD")(2439).innertext


  29. .Quit

  30. End With

  31. Next
  32. MsgBox "Complete!" & vbCrLf & "用时:" & " " & Timer - t & "秒"
  33. End Sub
复制代码


IE大法试试  网页格式不太规律

需求表.zip

37.71 KB, 下载次数: 39

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-20 13:24 , Processed in 0.037408 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表