ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1529|回复: 8

[求助] 正则匹配问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-7-25 14:21 | 显示全部楼层 |阅读模式
正则表达式:.*?
匹配文本:12d

这个匹配的结果为何不是 12d,而是空,没有字符。为什么?

TA的精华主题

TA的得分主题

发表于 2018-7-25 14:35 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-7-25 14:40 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-7-25 14:46 来自手机 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
是 空的 ,那就对了,不是空的那就有问题了!

TA的精华主题

TA的得分主题

发表于 2018-7-25 15:09 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
把问号去掉就能匹配上了

TA的精华主题

TA的得分主题

发表于 2018-7-25 15:11 | 显示全部楼层
空就对了,不空就不对了                                                                        

TA的精华主题

TA的得分主题

发表于 2018-7-26 21:17 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
.表示任意字符
*表示可重复0到n次
.*表示任意字符可重复0到n次。重复0次的话就是空。
最后的?表示惰性匹配,就是说匹配最少。
.*重复0次是最少的,所以结果是匹配空字符。

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-28 19:35 | 显示全部楼层
谢谢大家的讲解,我想明白了。

TA的精华主题

TA的得分主题

发表于 2018-7-28 21:31 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 gbgbxgb 于 2018-7-30 11:07 编辑
tombear 发表于 2018-7-28 19:35
谢谢大家的讲解,我想明白了。

真想明白了?!!!!
依我看,“大家的讲解”对你几乎没什么帮助,故如果你说“谢谢大家帮顶”倒很贴切。

试着解释如下:
1.Pattern=".*?",其中“?”与“*”构成一个整体,有个称谓,称为忽略优先量词,从匹配角度看,应用忽略优先量词的匹配可称为忽略优先匹配,再如“??”、"+?"等也是忽略优先量词。
2.接上述1,既然是忽略优先匹配,所以在其后的元字符序列(理应有其它的元字符序列,否则单独使用*?没什么意义)匹配不成功时,“.*?”才尝试匹配(大白话可理解为吞掉字符以便后续字符可匹配其它的元字符序列。对不住了,此处拗口了,^_^。看不懂,没关系,接着往下看第4点)。
3.忽略优先匹配不能按其字面意思理解成不匹配,其真正意思是在满足其最小下限{n,}的情况下尽量不匹配!!譬如正则表达式“.+?\d”应用于字符串“12d”,所得结果只有一个:12,即其中的1对应于正则表达式”.+“,“.+”表达式至少要匹配一个字符。相应的,若正则表达式为“.*”,则其至少要匹配0个字符(0个字符?废话?^_^)。

4.举例:
(1)字符串“12d”,正则表达式Pattern=".*?\d",执行后,匹配成功的有2个:1和2
(2)字符串“a12d”,正则表达式Pattern=".*?\d",执行后,匹配成功的有2个:a1和2
(3)字符串“adsdd12d”,正则表达式Pattern=".*?\d",执行后,匹配成功的有2个:adsdd1和2
(4)字符串“123d4f”,正则表达式Pattern=".*?\d",执行后,匹配成功的有4个:1、2、3和d4
(5)字符串“123d4f”,正则表达式Pattern=".+?\d",执行后,匹配成功的有2个:12和3d4
好好看看上述例子,认真比较下,想想为什么取得的结果数字有的前缀有别的字符,有的没有(特别注意理解第(5)例)。


回到楼主本例,正如前面所说,“*?”单独使用,后面没有别的元字符序列时,是没有意义的,若非要说其有意义(即事实上该表达式是能匹配成功的),可把“.*?”后面看成跟了一个空字符,即""。这有意义吗?^_^。到此就好理解了,即空字符总是能匹配成功的,“12d”总共匹配成功了4次,返回的是4个空字符。亦即可以认为“.*?"没有起任何作用,因为匹配空字符总是成功的。

事后补充:
1.表达式:*?、??、+?、{n,}?(注:n代表某一数字,后面的m亦代表某一数字)、{n,m}?均为忽略优先量词。
2.从前述1可看出,所有的忽略优先量词均可用“{n,}?”或“{n,m}?”的通用表达式予以表示({n}是个特例,因为{n}?与{n}是同等效果)。
3.忽略优先匹配的其他叫法有:非贪婪匹配、懒惰匹配、惰性匹配、勉强匹配等。其实,从前述来看,忽略优先匹配的叫法容易误导初学者以为不用匹配。从这个角度看,还是其他叫法较贴切。总之,怎么称呼无所谓,理解其在正则表达式中的作用才是重点。





您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-11 04:12 , Processed in 0.026901 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表