ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1176|回复: 15

[求助] 正则表达式的求助

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-3-2 16:28 | 显示全部楼层 |阅读模式
image.png

为啥这里<号不能匹配到第一个就停止,非要匹配到后一个呢?

TA的精华主题

TA的得分主题

发表于 2023-3-2 16:32 | 显示全部楼层
加个问号试试    >\S+?<

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-3-2 16:39 | 显示全部楼层
grf1973 发表于 2023-3-2 16:32
加个问号试试    >\S+?

兄弟,确实可以了。我正在学习正则表达式,能解释一下这个?为啥是加在这里吗?
?的定义是匹配0次或1次,我前面已经写了+,代表前面匹配1个以上的非空,
为啥后面加一个?

TA的精华主题

TA的得分主题

发表于 2023-3-2 16:58 | 显示全部楼层
匹配是贪心的,总想多匹配一点。。。。
+?就强制找第一个匹配

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-3-2 17:16 | 显示全部楼层
grf1973 发表于 2023-3-2 16:58
匹配是贪心的,总想多匹配一点。。。。
+?就强制找第一个匹配

我正是看到这里,实在有点看不明白,懒惰模式,贪婪模式,好像在工具里面没法实验,
包括开头的^和结束的$,好像在工具里面也没用。

TA的精华主题

TA的得分主题

发表于 2023-3-2 17:23 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
ovxyz 发表于 2023-3-2 16:39
兄弟,确实可以了。我正在学习正则表达式,能解释一下这个?为啥是加在这里吗?
?的定义是匹配0次或1次 ...

存在一些概念(或术语)要理清楚。
如下量词叫匹配优先量词:
*、?、+、{n}、{n,m}
如下量词叫忽略优先量词:
*?、??、+?、{n}?、{n,m}?
忽略优先量词中的后缀“?”与前面元字符构成一个整体,不可拆开来理解。
忽略优先量词的含义可顾名思义,即忽略优先。如果还不理解,具体陈述如下,在极限匹配已成功的情况下,尽量不要继续匹配了,只有在自身匹配不成功时,才继续匹配。

例如,字符串“我的吉祥数字是是是是是123456”,用正则式“是+?\d+”去匹配,得到的过程(大致描述)应该是这样滴:
由于正则式中用的量词为“+?”,故是忽略优先量词,故正则式仅匹配一个“是”就判断匹配成功,紧接着就开始匹配正则式的第二部分“\d+”,因为字符串中第1个“是”的后面跟着的不是数字,所以匹配失败,此时,正则式回溯至第1部分“是+?”,因为是“+”,故可接着匹配,于是又匹配成功,此时得到的“是是",还是因为忽略优先的缘故,此时正则式尝试匹配第2部分的”\d+“,显然,匹配失败,于是乎……,于是乎……,最终,匹配到5个”是“的时候,即”是是是是是“,才发现后面的”12345“匹配”\d+",最终,所有的正则式匹配皆成功。

码了不少字,就当自个儿温故而知新吧。

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-3-2 17:40 | 显示全部楼层
本帖最后由 ovxyz 于 2023-3-2 17:42 编辑
gbgbxgb 发表于 2023-3-2 17:23
存在一些概念(或术语)要理清楚。
如下量词叫匹配优先量词:
*、?、+、{n}、{n,m}

十分感谢。学到了。原来+?是一起理解的。学无止境。

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-3-2 18:34 | 显示全部楼层
gbgbxgb 发表于 2023-3-2 17:23
存在一些概念(或术语)要理清楚。
如下量词叫匹配优先量词:
*、?、+、{n}、{n,m}

我在继续咨询一下,例如
>2345<
要匹配2345
1、匹配前面为>的数字
用vba好像只能><一共匹配进去,无法直接排除开头和结束的匹配字符。
我但我用其他正则的方式查询了一下,貌似有方法排除开头和结束的字符。
例如,文章是这样写的
1、匹配前面为A的B
(?<=A)B

但为啥这样的方式在vba里面不起作用。我后来查阅听说vba的正则表达式是阉割过的,不知道是不是如此。

TA的精华主题

TA的得分主题

发表于 2023-3-2 20:03 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
ovxyz 发表于 2023-3-2 18:34
我在继续咨询一下,例如
>2345<
要匹配2345

VBScript仅支持往前(即右侧方向)检索,不支持往后(即左侧方向,字符串的逆向)检索,即不支持后瞻断言。
后瞻断言是有缺点的,即该断言内的正则表达式受到限制。它必须是固定长度的,或者通过某种方式能够确定其长度。因为搜索引擎必须知道应该向后退几个字符(即后瞻几个字符)进行搜索。所以后瞻断言就不被广泛支持,比如JavaScript也不支持后瞻断言。
说VBA的正则被阉割,这话太糙了,容易让人误解。VBSript即便不支持后瞻断言,其分析处理文本的灵活性还是有目共睹的。
你只想取字符串“>2345<”中数字,可以用括号捕获数字,然后用.Submatches属性呈现它,正则式如下所示:
theStr=">2345<>6789<>01279<>66677299<"
.Pattern=">(\d+)<"
.Global=true
呈现它:
Debug.Print .Execute(theStr)(0).Submatches(0)
结果应该是 2345

当然了,也可以这样:
Set theMatches=.Execute(theStr)
for each mymatch in theMatches
debug.print mymatch.submatches(0)
next mymatch
结果应该是好多:
2345
6789
01279
66677279

评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2023-3-2 22:20 | 显示全部楼层
gbgbxgb 发表于 2023-3-2 20:03
VBScript仅支持往前(即右侧方向)检索,不支持往后(即左侧方向,字符串的逆向)检索,即不支持后瞻断言 ...

我的正则也学的不好,在这里又学习了一下。真是“三人行必有我师焉”
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-18 20:48 , Processed in 0.041750 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表