ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1338|回复: 4

[求助] 用VBA抓取网页内的数据

[复制链接]

TA的精华主题

TA的得分主题

发表于 2020-8-1 10:43 | 显示全部楼层 |阅读模式
http://data.eastmoney.com/hsgtcg/hy.html
以上页面是 北向资金增持行业板块排行情况我想按照日期通过VBA抓取这个网站的数据。由于刚刚学习VBA,在home里学习很多前辈的抓取代码但是无法成功,麻烦哪位大神帮忙一下,谢谢!

TA的精华主题

TA的得分主题

发表于 2020-8-3 06:13 | 显示全部楼层
试下这一段代码,在我的电脑上是成功的。
另外,如果有多页,需要模拟点击,这个你搜一下吧。

Private Sub CommandButton1_Click()
    On Error GoTo errexit:
'Dim IE As New InternetExplorer
    Dim BoxAllData
    Dim num As Object
    Dim btn As Object
    Dim tlb As Object, td As Object
    Dim i As Long, StartRow As Long, startCOl As Long
    Dim IE As Object    'As New InternetExplorer
    Set IE = CreateObject("InternetExplorer.Application")

    StartRow = 3    'excel 开始的行
    startCOl = 1    'excel 开始的列
    IE.Visible = True
    IE.navigate "http://data.eastmoney.com/stock/tradedetail.html"    '打开网址
     
     Application.Wait Now + TimeSerial(0, 0, 3)    '程序暂停3秒,等待loaded
    Do While IE.readystate <> 4  'Wait till page is loaded
        i = i + 1
        If i > 30000 Then Exit Do    '有时候会停顿,增加也给计数器,如果load的时间太长,就跳出,防止死循环
        DoEvents
    Loop

    'TextBox1 = IE.document.Body.outerHTML '可以获得该文件的html代码
    Dim tableX As Object, Row As Object, iRow As Long, iCOl As Long
    Set tableX = IE.document.getElementsByTagName("table")(1)     ' 如果不知道是哪一个表,就挨个尝试

    '设置标题
    Set Row = tableX.Rows(0)    '第0行是标题
     For iCOl = 0 To Row.Cells.Length - 1
        '显示内容,注意在EXCEL里RANGE集合取表格位是从1开始,所以要加1
        Cells(2, startCOl + iCOl) = Row.Cells(iCOl).innerText
    Next
     
     '表的值
    For iRow = 1 To tableX.Rows.Length - 1    '第0行是标题,跳过
        DoEvents
        Excel.Application.StatusBar = iRow
        Set Row = tableX.Rows(iRow)
        '遍历每行所有表格
        For iCOl = 0 To Row.Cells.Length - 1
            '显示内容,注意在EXCEL里RANGE集合取表格位是从1开始,所以要加1
            Cells(StartRow, startCOl + iCOl) = Row.Cells(iCOl).innerText
        Next
        StartRow = StartRow + 1
    Next
   
     '释放IE对象
     IE.Quit
    Set IE = Nothing
    MsgBox "done"
     Exit Sub
errexit:

    MsgBox Err & ":" & Err.Description, vbCritical, "Error"
End Sub

VBA 爬网.zip

23.01 KB, 下载次数: 17

TA的精华主题

TA的得分主题

发表于 2020-8-3 08:24 | 显示全部楼层
duzili 发表于 2020-8-3 06:13
试下这一段代码,在我的电脑上是成功的。
另外,如果有多页,需要模拟点击,这个你搜一下吧。

感谢分享,收藏慢慢消化

TA的精华主题

TA的得分主题

发表于 2020-8-3 08:45 | 显示全部楼层
duzili 发表于 2020-8-3 06:13
试下这一段代码,在我的电脑上是成功的。
另外,如果有多页,需要模拟点击,这个你搜一下吧。

这个厉害,

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-8-5 06:03 | 显示全部楼层
duzili 发表于 2020-8-3 06:13
试下这一段代码,在我的电脑上是成功的。
另外,如果有多页,需要模拟点击,这个你搜一下吧。

感谢分享。下载学习。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-23 18:08 , Processed in 0.040970 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表