ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: liucqa

[原创] 网页采集(网页提交)教程第一课-用XMLHTTP获取数据并用Adodb.Stream转换编码提取信息

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2012-7-17 00:21 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖已被收录到知识树中,索引项:网页交互
本帖最后由 引子玄 于 2012-7-17 00:29 编辑

向前辈请教,如何翻动网页?
这5页地址分别是:
http://www.sdzs.gov.cn/score/gaokao/2012/0715/Book1.files/sheet001.htm
http://www.sdzs.gov.cn/score/gaokao/2012/0715/Book2.files/sheet001.htm
http://www.sdzs.gov.cn/score/gaokao/2012/0715/Book3.files/sheet001.htm
http://www.sdzs.gov.cn/score/gaokao/2012/0715/Book4.files/sheet001.htm
http://www.sdzs.gov.cn/score/gaokao/2012/0715/Book5.files/sheet001.htm

========================================================
附代码如下(QueryTables对象法),能否帮修改一下?(代码中的Book1如何写变量?)

Sub 如何翻动网页()
Dim i As Integer
Application.ScreenUpdating = False
For i = 1 To 5

    With ActiveSheet.QueryTables.Add(Connection:= _
        "URL;http://www.sdzs.gov.cn/score/gaokao/2012/0715/Book1.files/sheet001.htm", _
        Destination:=Range("A" & 78 * (i - 1) + 1))
        .Name = "sheet001"
        .FieldNames = True
        .RowNumbers = False
        .FillAdjacentFormulas = False
        .PreserveFormatting = True
        .RefreshOnFileOpen = False
        .BackgroundQuery = True
        .RefreshStyle = xlInsertDeleteCells
        .SavePassword = False
        .SaveData = True
        .AdjustColumnWidth = True
        .RefreshPeriod = 0
        .WebSelectionType = xlAllTables
        .WebFormatting = xlWebFormattingNone
        .WebPreFormattedTextToColumns = True
        .WebConsecutiveDelimitersAsOne = True
        .WebSingleBlockTextImport = False
        .WebDisableDateRecognition = False
        .WebDisableRedirections = False
        .Refresh BackgroundQuery:=False
    End With

Next i
Application.ScreenUpdating = True

End Sub


TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-17 00:25 | 显示全部楼层
我认为你应该发一个新贴,而不是在这个贴里面等着我给你改代码。

要知道,俺最不愿意干的事情就是改代码了

TA的精华主题

TA的得分主题

发表于 2012-7-17 00:47 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 引子玄 于 2012-7-17 00:50 编辑

被前辈逼上梁山,自己改出来了,参考了蓝天大师的点拨。
==========================================
Sub 翻动网页已解决()
Dim i As Integer
Application.ScreenUpdating = False
For i = 1 To 5
    With ActiveSheet.QueryTables.Add(Connection:= _
        "URL;http://www.sdzs.gov.cn/score/gaokao/2012/0715/Book" & i & ".files/sheet001.htm", _
        Destination:=Range("A" & 78 * (i - 1) + 1))
        .Name = "sheet001"
        .FieldNames = True
        .RowNumbers = False
        .FillAdjacentFormulas = False
        .PreserveFormatting = True
        .RefreshOnFileOpen = False
        .BackgroundQuery = True
        .RefreshStyle = xlInsertDeleteCells
        .SavePassword = False
        .SaveData = True
        .AdjustColumnWidth = True
        .RefreshPeriod = 0
        .WebSelectionType = xlAllTables
        .WebFormatting = xlWebFormattingNone
        .WebPreFormattedTextToColumns = True
        .WebConsecutiveDelimitersAsOne = True
        .WebSingleBlockTextImport = False
        .WebDisableDateRecognition = False
        .WebDisableRedirections = False
        .Refresh BackgroundQuery:=False
    End With
Next i
Application.ScreenUpdating = True
End Sub

TA的精华主题

TA的得分主题

发表于 2012-7-17 09:07 | 显示全部楼层
QueryTables在分析多个网页数据的时候还是不方便。
为了得到最终需要的数据,可能需要用到正则。
需要从这个帖子里面学的东西太多了,谢谢楼主分享,期待楼主更多教程

TA的精华主题

TA的得分主题

发表于 2012-7-17 09:11 | 显示全部楼层
这必须要学习一下,一直挺有兴趣

TA的精华主题

TA的得分主题

发表于 2012-7-17 09:47 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
liucqa 发表于 2012-7-16 14:28
用winhttp,get重定向之前的就行
.Option(6)=True

如果碰到无法获得网址的情况怎么办..地址栏通过一些手段隐藏起来,就无法获得网页信息

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-17 09:58 | 显示全部楼层
一条狗 发表于 2012-7-17 09:47
如果碰到无法获得网址的情况怎么办..地址栏通过一些手段隐藏起来,就无法获得网页信息

举一个链接的例子?

一般这种情况可以通过抓包软件解决。

TA的精华主题

TA的得分主题

发表于 2012-7-17 10:43 | 显示全部楼层
本帖最后由 kangatang 于 2012-7-17 10:44 编辑

咋么没有第二课了。
题材来了
http://club.excelhome.net/thread-892195-3-1.html
帮我看看,网址中有个该死的  sid号码,过期会失效(虽然时间足够长)
基本上已经可以下载。但并不那么方便,有时候还要找个SID。(见29楼)

TA的精华主题

TA的得分主题

 楼主| 发表于 2012-7-17 12:22 | 显示全部楼层
本帖最后由 liucqa 于 2012-7-17 12:22 编辑
kangatang 发表于 2012-7-17 10:43
咋么没有第二课了。
题材来了
http://club.excelhome.net/thread-892195-3-1.html

呵呵,这个网站的有登录密码,不适合做教程。

我之前回帖说过,要从初始链接开始进入,在网页源代码中取得post提交的参数,然后再进入提取数据的链接,这样就可以了

俺一直就没登录进这个网站,只能提个建议了

TA的精华主题

TA的得分主题

发表于 2012-7-17 12:57 | 显示全部楼层
liucqa 发表于 2012-7-17 12:22
呵呵,这个网站的有登录密码,不适合做教程。

我之前回帖说过,要从初始链接开始进入,在网页源代码中 ...

https://libproxy.eku.edu/login
user        Bridgette_knight8
pass        comma14down

就进去了,点击"Web of Knowledge"进入搜索页面
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-18 15:39 , Processed in 0.031164 second(s), 6 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表