ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1028|回复: 4

[求助] 正则表达式获得总页码出错,求修正

[复制链接]

TA的精华主题

TA的得分主题

发表于 2016-3-22 22:46 | 显示全部楼层 |阅读模式
以下为网页的部分内容:
...............>27</a>
<a href=?sortfd=%e6%b6%a8%e8%b7%8c%e5%b9%85&marketid=&hy=&sectypeid=1&sortway=desc&scb=&stockcode=&page=28&mystock= target=_self>28</a>
<a href=?sortfd=%e6%b6%a8%e8%b7%8c%e5%b9%85&marketid=&hy=&sectypeid=1&sortway=desc&scb=&stockcode=&page=29&mystock= target=_self>29</a>
<a href=?sortfd=%e6%b6%a8%e8%b7%8c%e5%b9%85&marketid=&hy=&sectypeid=1&sortway=desc&scb=&stockcode=&page=2&mystock= target=_self>下一页</a>
</div><!--/93.421875--></div>

Private Sub CommandButton1_Click()
    Dim str As String
    Dim Regex As Object
    Set Regex = CreateObject("vbscript.regexp")
    With Regex
        .Global = True  '全局有效
        .MultiLine = True   '多行有效
        .IgnoreCase = True    '忽略大小写
    End With
    str = Cells(2, "B").Value     '此为第1种字符串,运行正常
    Regex.Pattern = Cells(3, "B").Value
    Cells(4, "B") = Regex.Execute(str).Item(0)
    Cells(5, "B") = Regex.Execute(str).Item(0).SubMatches(0)
    Set Regex = Nothing  '清空正则项目
End Sub


我用正则表达式(\d+)</a>\n<a[\s\S][^>]*?>下一页</a>获得如下部分内容:
29</a>
<a href=?sortfd=%e6%b6%a8%e8%b7%8c%e5%b9%85&marketid=&hy=&sectypeid=1&sortway=desc&scb=&stockcode=&page=2&mystock= target=_self>下一页</a>



沪深涨跌幅.rar

15.4 KB, 下载次数: 6

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-3-22 22:49 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
可是用下面的方法,为什么就运行出错,不知道错在哪,求助修改


Private Sub CommandButton1_Click()
    Dim str As String
    Dim Regex As Object
    Set Regex = CreateObject("vbscript.regexp")
    With Regex
        .Global = True  '全局有效
        .MultiLine = True   '多行有效
        .IgnoreCase = True    '忽略大小写
    End With
    '''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
    Open ThisWorkbook.Path & "\沪深涨跌幅.txt" For Binary As #1
    str = Input(LOF(1), #1)     '此为第2种字符串,运行出错
    Close #1
    '''''''''''''''''''''''''''''''''''''''''''''''''''''''''''
    Regex.Pattern = Cells(3, "B").Value
    Cells(4, "B") = Regex.Execute(str).Item(0)
    Cells(5, "B") = Regex.Execute(str).Item(0).SubMatches(0)
    Set Regex = Nothing  '清空正则项目
End Sub

TA的精华主题

TA的得分主题

发表于 2016-3-23 00:11 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
pattern=(\d+)</a>\r\n<a.*?>
这儿涉及到一个知识点,回车换行是两个元字符分别对应\r \n

TA的精华主题

TA的得分主题

发表于 2016-3-23 00:17 | 显示全部楼层
参考附件:楼主的信息在附件中并没有截全,所以只给了取一般页码的pattern,取总页码只要在后面再加代表结束的下一页即可。其关键疑难点在\r\n,如上楼所示。剩下的楼主应该可以自己改好。

沪深涨跌幅.rar

22.83 KB, 下载次数: 5

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-3-23 10:56 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
谢谢龙城飞将III的解答!
经测试,获得最大页码的正则表达式:
(\d+)</a>\r\n<a[\s\S][^>]*?>下一页</a>

改为换行回车对应\n\r 正则就会出错。
(\d+)</a>\n\r<a[\s\S][^>]*?>下一页</a>

原来是有先后顺序的,严谨表达式。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-25 06:50 , Processed in 0.034061 second(s), 16 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表