ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1319|回复: 5

[求助] 只要抓取网页中加号伸缩部分的表格数据

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-6-17 08:42 | 显示全部楼层 |阅读模式
请教坛中大师们,网页中有加号需要展开,只要取网页中部分表格内容,能在剪贴板里就取好再paste到sheet中吗?全部网页处理好像速度较慢!同样问题有位大师是把这个网页数据从剪贴板paste到sheet的,还是要先感谢这位大师,这位大师还指出是第15个</tbody>。不知道有无方法直接就抓取这部分数据?谢谢!并祝坛中大师们粽子节快乐!!

网页中有加号

网页中有加号

加号打开后的表格

加号打开后的表格

2113_扫描【网管全量】_2018_06_05_html.zip

561.59 KB, 下载次数: 3

原始网页文件

漏洞汇总表.rar

7.73 KB, 下载次数: 4

希望的结果

TA的精华主题

TA的得分主题

发表于 2018-6-21 16:03 | 显示全部楼层
  1. <!--<span.*?>(.*?)</span></td>-->(.*\n)*?.*?受影响主机</th>\n.*?<td.*?>(.*)\n(.*\n)*?.*?详细描述</th>\n.*?<td>((.*\n)*?.*?)</td>\n(.*\n)*?.*?解决办法</th>\n.*?<td>((.*\n)*?.*?)</td>
复制代码


共856,每个Match中的都有9个Group,其中 1、3、5、8 四个Group就是你要的数据

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-23 19:50 | 显示全部楼层
lsdongjh 发表于 2018-6-21 16:03
共856,每个Match中的都有9个Group,其中 1、3、5、8 四个Group就是你要的数据

Is侠:按您的正则测试了很正确!但能冒昧请求您写个完整的vba吗?4个Group还是不会弄到表格里去!先谢谢了!我是一个很菜的菜鸟,还望得到Is侠的指点!

TA的精华主题

TA的得分主题

发表于 2018-6-25 14:00 | 显示全部楼层
  1. Sub Test()
  2.     Dim strPath As String
  3.     Dim ObjStream As Object, objReg As Object, strPat As String
  4.     Dim objMatchs As Object, objMatch As Object
  5.     Dim strTemp As String, arrResult As Variant
  6.     Dim lngRows As Long, lngIndex As Long
  7.    
  8.     strPath = ThisWorkbook.Path & "\index.html"
  9.    
  10.     Set ObjStream = CreateObject("Adodb.Stream")
  11.     With ObjStream
  12.         .Mode = 3
  13.         .Type = 1
  14.         .Open
  15.         .LoadFromFile strPath
  16.         .Position = 0
  17.         .Type = 2
  18.         .Charset = "UTF-8"
  19.         strTemp = .readtext
  20.     End With
  21.    
  22.     Set ObjStream = Nothing
  23.    
  24.     strPat = "<!--<span.*?>(.*?)</span></td>-->(.*\n)*?.*?受影响主机</th>\n.*?<td.*?>(.*)\n(.*\n)*?.*?详细描述</th>\n.*?<td>((.*\n)*?.*?)</td>\n(.*\n)*?.*?解决办法</th>\n.*?<td>((.*\n)*?.*?)</td>"

  25.     Set objReg = CreateObject("VBScript.RegExp")
  26.     With objReg
  27.         .Global = True
  28.         .Pattern = strPat
  29.     End With

  30.     Set objMatchs = objReg.Execute(strTemp)
  31.     lngRows = objMatchs.Count + 1
  32.     ReDim arrResult(1 To lngRows, 1 To 5)
  33.     arrResult(1, 1) = "序号"
  34.     arrResult(1, 2) = "漏洞名称"
  35.     arrResult(1, 3) = "受影响主机"
  36.     arrResult(1, 4) = "详细描述"
  37.     arrResult(1, 5) = "解决办法"
  38.     lngIndex = 2
  39.    
  40.     For Each objMatch In objMatchs
  41.       arrResult(lngIndex, 1) = lngIndex - 1
  42.       arrResult(lngIndex, 2) = objMatch.subMatches(0)
  43.       arrResult(lngIndex, 3) = objMatch.subMatches(2)
  44.       arrResult(lngIndex, 4) = objMatch.subMatches(4)
  45.       arrResult(lngIndex, 5) = objMatch.subMatches(7)

  46.       lngIndex = lngIndex + 1
  47.     Next

  48.     Sheet1.Range("A1").Resize(lngRows, 5) = arrResult
  49. End Sub
复制代码

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-25 15:19 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册

感谢,非常感谢!快了不止5倍!!!

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-25 22:56 | 显示全部楼层
guanlearn 发表于 2018-6-25 15:19
感谢,非常感谢!快了不止5倍!!!

Is侠:不好意思,又来打扰您了!首先非常感谢!but在遍历submatches时,发现4和5、7和8有部分是重复的。怎么回事呢?能帮忙分析分析吗?再次表示感谢!!
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-27 05:41 , Processed in 0.040555 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表