ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 3490|回复: 14

[分享] VBA爬取网页信息实例

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-1-20 02:23 | 显示全部楼层 |阅读模式
Sub 获取网页信息()
    Dim cnnObject As Object, strText, j$, js As Object
    t1 = Timer
    Set cnnObject = CreateObject("msxml2.xmlhttp")
    For I = 1 To 10
        cnnObject.Open "GET", "http://218.12.43.28:2018/pub/gongshi?pageIndex=" & I, False
line4:
        cnnObject.send

        Do Until cnnObject.readystate = 4
            DoEvents
        Loop
        If cnnObject.Status <> 200 Then
            GoTo line4
        End If

        strText = cnnObject.responseText
        With CreateObject("vbscript.regexp")
            .Global = True
            .Pattern = "<tr bgcolor=.*>\s*<td>\s*(\d*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td height=.*>\s*(\S*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td>\s*(\d*)\s*</td>\s*<td>\s*(\S*)\s*</td>\s*<td>\s*(\d*.\d{2})\s*</td>\s*<td>\s*(\d*.\d{2})\s*</td>\s*<td>\s*(\d*.\d{2})\s*</td>\s*<td>\s*(\S*)\s*</td>\s*</tr>"
                Set mat = .Execute(strText)
                For Each m In mat
                    n = n + 1
                    For I2 = 1 To 15
                    Sheets("temp").Cells(n, I2) = .Replace(m, "$" & I2)
                    Next
                Next m
        End With
        Sheets("temp").Columns("A:O").AutoFit
        Sheets("temp").UsedRange.Font.Size = 9
    Next
    t2 = Timer - t1
    MsgBox ("用时" & Format(t2, "0.00") & "秒")
End Sub

评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2019-1-20 10:12 | 显示全部楼层
这个怎么用???

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-1-20 11:50 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
yjgy6669 发表于 2019-1-20 10:12
这个怎么用???

贴到VBE里运行。

TA的精华主题

TA的得分主题

发表于 2019-1-20 12:53 | 显示全部楼层
本帖最后由 五指山888 于 2019-1-20 12:55 编辑

学习了很好的,网址如何解析出来?

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-1-20 12:56 | 显示全部楼层
五指山888 发表于 2019-1-20 12:53
学习了很好的,网址如何解析出来?

解析网页有好几种方法,这里用正则解析的。

TA的精华主题

TA的得分主题

发表于 2019-1-20 15:01 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-1-20 15:19 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
mfz1975 发表于 2019-1-20 15:01
老师怎么提示下标越界?

你在你的工作簿中增加一个工作表,改名为temp,就不会提示下标越界。temp表是用来存放下载数据的。

TA的精华主题

TA的得分主题

发表于 2019-1-20 16:09 | 显示全部楼层
本帖最后由 mfz1975 于 2019-1-20 17:16 编辑
chentonny 发表于 2019-1-20 15:19
你在你的工作簿中增加一个工作表,改名为temp,就不会提示下标越界。temp表是用来存放下载数据的。

感谢老师的指导,我按照您的方法实现了,还的麻烦您指点一下,我这个怎样能在temp中加入标题,提取的数据在标题下开始写入。现将附件上传请老师指点。十分抱歉刚才传错附件了。

网页信息提取.rar

25.85 KB, 下载次数: 71

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-1-22 21:37 | 显示全部楼层
mfz1975 发表于 2019-1-20 16:09
感谢老师的指导,我按照您的方法实现了,还的麻烦您指点一下,我这个怎样能在temp中加入标题,提取的数据 ...

数据下下来了,一个标题自己搞定不是难事吧

TA的精华主题

TA的得分主题

发表于 2019-1-23 16:45 | 显示全部楼层
亲,方法很好。有个问题,怎么知道网面总共分了多少页呢?还有,下载稍稍有点慢呢。谢
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-26 12:39 , Processed in 0.048595 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表