|
本帖最后由 gbgbxgb 于 2018-7-30 11:07 编辑
真想明白了?!!!!
依我看,“大家的讲解”对你几乎没什么帮助,故如果你说“谢谢大家帮顶”倒很贴切。
试着解释如下:
1.Pattern=".*?",其中“?”与“*”构成一个整体,有个称谓,称为忽略优先量词,从匹配角度看,应用忽略优先量词的匹配可称为忽略优先匹配,再如“??”、"+?"等也是忽略优先量词。
2.接上述1,既然是忽略优先匹配,所以在其后的元字符序列(理应有其它的元字符序列,否则单独使用*?没什么意义)匹配不成功时,“.*?”才尝试匹配(大白话可理解为吞掉字符以便后续字符可匹配其它的元字符序列。对不住了,此处拗口了,^_^。看不懂,没关系,接着往下看第4点)。
3.忽略优先匹配不能按其字面意思理解成不匹配,其真正意思是在满足其最小下限{n,}的情况下尽量不匹配!!譬如正则表达式“.+?\d”应用于字符串“12d”,所得结果只有一个:12,即其中的1对应于正则表达式”.+“,“.+”表达式至少要匹配一个字符。相应的,若正则表达式为“.*”,则其至少要匹配0个字符(0个字符?废话?^_^)。
4.举例:
(1)字符串“12d”,正则表达式Pattern=".*?\d",执行后,匹配成功的有2个:1和2
(2)字符串“a12d”,正则表达式Pattern=".*?\d",执行后,匹配成功的有2个:a1和2
(3)字符串“adsdd12d”,正则表达式Pattern=".*?\d",执行后,匹配成功的有2个:adsdd1和2
(4)字符串“123d4f”,正则表达式Pattern=".*?\d",执行后,匹配成功的有4个:1、2、3和d4
(5)字符串“123d4f”,正则表达式Pattern=".+?\d",执行后,匹配成功的有2个:12和3d4
好好看看上述例子,认真比较下,想想为什么取得的结果数字有的前缀有别的字符,有的没有(特别注意理解第(5)例)。
回到楼主本例,正如前面所说,“*?”单独使用,后面没有别的元字符序列时,是没有意义的,若非要说其有意义(即事实上该表达式是能匹配成功的),可把“.*?”后面看成跟了一个空字符,即""。这有意义吗?^_^。到此就好理解了,即空字符总是能匹配成功的,“12d”总共匹配成功了4次,返回的是4个空字符。亦即可以认为“.*?"没有起任何作用,因为匹配空字符总是成功的。
事后补充:
1.表达式:*?、??、+?、{n,}?(注:n代表某一数字,后面的m亦代表某一数字)、{n,m}?均为忽略优先量词。
2.从前述1可看出,所有的忽略优先量词均可用“{n,}?”或“{n,m}?”的通用表达式予以表示({n}是个特例,因为{n}?与{n}是同等效果)。
3.忽略优先匹配的其他叫法有:非贪婪匹配、懒惰匹配、惰性匹配、勉强匹配等。其实,从前述来看,忽略优先匹配的叫法容易误导初学者以为不用匹配。从这个角度看,还是其他叫法较贴切。总之,怎么称呼无所谓,理解其在正则表达式中的作用才是重点。
|
|