ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 929|回复: 6

[求助] 关于正则表达式如何识别多项关键字并返回结果的问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-11-15 18:27 | 显示全部楼层 |阅读模式
比如我现在要梳理一份施工合同清单,对于其中的混凝土项目,可能会有以下几种关键字:
(1)混凝土等级:C15、C20、C25、C30等等;
(2)抗渗等级:无抗渗、P6、P8、P10
(2)混凝土类别:普通混凝土、膨胀混凝土;
(3)混凝土部位:垫层、板、墙柱、梁、其他部位;
膨胀砼的单价和普通砼不一样,垫层位置的单价和其他部位的不一样,不同抗渗等级单价不一样。
对于一个混凝土清单项目的描述,以上4项中,(1)是必须出现的,(2)、(3)、(4)中的膨胀砼、垫层、P6、P8、P10不一定出现。
因为(2)、(3)、(4)各自在描述中出现的先后顺序是固定的,所以我想编一个通用的正则表达式,当这些的关键字出现时就获取他们,不出现就不获取。
比如以下几个字符串:
【1】“C25现浇混凝土,抗渗等级P6”,能够获取到“C25P6”;
【2】“C35膨胀混凝土于后浇带,抗渗等级P8”,能够获取到“C35膨胀混凝土P8”
【3】“C15混凝土垫层”,能够获取到“C15垫层”
我想用.pattern="(\w*).*(膨胀砼)?.*(P[0-9]*)?.*(垫层)?",然后将submatches的内容串起来,但是不管膨胀砼、P[0-9]*、垫层是否在字符中出现,返回的结果都不会显示这几个关键字。
?的意思是代表出现0次或者1次,但计算机进行匹配时,当字符串中包含关键字的时候,也返回0次的结果。请问该怎么改进?

测试文档.zip

12.27 KB, 下载次数: 11

测试文档

TA的精华主题

TA的得分主题

发表于 2019-11-15 20:38 | 显示全部楼层
  1. Sub GetHref()
  2.     Dim reg As Object
  3.     Dim str(1 To 3) As String, i%
  4.     Set reg = CreateObject("VBScript.Regexp")
  5.     str(1) = "C25现浇混凝土,抗渗等级P6"
  6.     str(2) = "C35膨胀混凝土于后浇带,抗渗等级P8"
  7.     str(3) = "C15混凝土垫层"
  8.     reg.Global = True
  9.     reg.Pattern = ".*?(\w+|膨胀混凝土|垫层)|.+"
  10.     For i = 1 To 3
  11.             str(i) = reg.Replace(str(i), "$1")
  12.         MsgBox str(i)
  13.     Next i
  14. End Sub
复制代码

TA的精华主题

TA的得分主题

发表于 2019-11-15 20:54 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
按2楼的方法,修改下 Pattern
  1. reg.Pattern = ".*?(C\d+|普通混凝土|膨胀混凝土|P\d|无抗渗|垫层|板|墙柱|梁|其他部位)|.+"
复制代码

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-11-16 16:21 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-11-16 16:22 | 显示全部楼层
DevilW 发表于 2019-11-15 20:54
按2楼的方法,修改下 Pattern

嗯,这样写更具体,避免字符串中混入其他的数字和字母

TA的精华主题

TA的得分主题

发表于 2019-11-16 16:46 | 显示全部楼层
明明朗 发表于 2019-11-16 16:22
嗯,这样写更具体,避免字符串中混入其他的数字和字母

即使要更具体,那\d后面的加号"+"是不能省略的。

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-11-16 17:07 | 显示全部楼层
ggmmlol 发表于 2019-11-16 16:46
即使要更具体,那\d后面的加号"+"是不能省略的。

嗯,对,确实是这样,谢谢提醒。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-3-29 21:20 , Processed in 0.051382 second(s), 10 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表