ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
12
返回列表 发新帖
楼主: excel_hero

[已解决] 如何提取出复杂标点符号(大括号, 中括号, 逗号, 双引号和冒号)之间的目标字符串

[复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-5-21 17:48 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
ggmmlol 发表于 2019-4-23 08:37
按楼主要求应该是"$1 ",使用空格做多项之间的分隔符,但因为空格在动图中不显著,所以我用逗号分隔来演 ...

老师好!

之前案例场景未考虑全面, 其实里面想要提取的字符串带有不定个数的空格, 也就是变为比如说:
{"abc_apple":"","abc_apple-apple":"Mi Brand"}
   {"abc_apple":"","abc_apple-apple":"China Good Country"}

想要提取出
"Mi Brand"
"China Good Country"
, 正则表达式应该怎么优化下呢?

谢谢呀!

TA的精华主题

TA的得分主题

发表于 2019-5-21 18:26 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
把\w改为[^"]并把括号外的引号放入括号内:

.*?:("[^"]*")}|.+

提取.gif

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-5-21 22:32 | 显示全部楼层
ggmmlol 发表于 2019-5-21 18:26
把\w改为[^"]并把括号外的引号放入括号内:

.*?:("[^"]*")}|.+

验证了下, 确实可行.

不过两边的双引号无需提取出来, 有逗号作为分隔开就够了. 我尝试着用
.*?:([^"]*)}|.+

却无效....:-)

可以去掉吗?

TA的精华主题

TA的得分主题

发表于 2019-5-22 09:34 | 显示全部楼层
本帖最后由 libo5563 于 2019-5-22 12:21 编辑

看数据挺规律的,pq 里的拆分 从右第一个 分割符应该可以用  如果考虑数据在行里会增加,就在第一次拆分时 按照每个};{  中间的;选拆分到行,再建序数列的办法,将要的数据筛选出来,再透视回来就行了



let
    源 = Excel.CurrentWorkbook(){[Name="表1"]}[Content],
    更改的类型 = Table.TransformColumnTypes(源,{{"#", Int64.Type}, {"源字符串", type text}, {"期待的效果(想要提取出的字符串)", type text}}),
    删除的列 = Table.RemoveColumns(更改的类型,{"期待的效果(想要提取出的字符串)", "#"}),
    按分隔符拆分列 = Table.SplitColumn(删除的列, "源字符串", Splitter.SplitTextByDelimiter("{", QuoteStyle.Csv), {"源字符串.1", "源字符串.2", "源字符串.3", "源字符串.4", "源字符串.5"}),
    更改的类型1 = Table.TransformColumnTypes(按分隔符拆分列,{{"源字符串.1", type text}, {"源字符串.2", type text}, {"源字符串.3", type text}, {"源字符串.4", type text}, {"源字符串.5", type text}}),
    删除的列1 = Table.RemoveColumns(更改的类型1,{"源字符串.1"}),
    已添加索引 = Table.AddIndexColumn(删除的列1, "索引", 1, 1),
    逆透视的其他列 = Table.UnpivotOtherColumns(已添加索引, {"索引"}, "属性", "值"),
    删除的列2 = Table.RemoveColumns(逆透视的其他列,{"属性"}),
    按分隔符拆分列1 = Table.SplitColumn(删除的列2, "值", Splitter.SplitTextByEachDelimiter({":"}, QuoteStyle.Csv, true), {"值.1", "值.2"}),
    更改的类型2 = Table.TransformColumnTypes(按分隔符拆分列1,{{"值.1", type text}, {"值.2", type text}}),
    删除的列3 = Table.RemoveColumns(更改的类型2,{"值.1"}),
    替换的值 = Table.ReplaceValue(删除的列3,"}","",Replacer.ReplaceText,{"值.2"}),
    替换的值1 = Table.ReplaceValue(替换的值,",","",Replacer.ReplaceText,{"值.2"}),
    替换的值2 = Table.ReplaceValue(替换的值1,"]","",Replacer.ReplaceText,{"值.2"}),
    分组的行 = Table.Group(替换的值2, {"索引"}, {{"计数", each Table.AddIndexColumn(_, "索引.1", 1, 1), type table}}),
    #"展开的“计数”" = Table.ExpandTableColumn(分组的行, "计数", {"索引", "值.2", "索引.1"}, {"索引.2", "值.2", "索引.1"}),
    删除的列4 = Table.RemoveColumns(#"展开的“计数”",{"索引.2"}),
    已透视列 = Table.Pivot(Table.TransformColumnTypes(删除的列4, {{"索引.1", type text}}, "zh-CN"), List.Distinct(Table.TransformColumnTypes(删除的列4, {{"索引.1", type text}}, "zh-CN")[索引.1]), "索引.1", "值.2")
in
    已透视列



4444.rar

1.16 MB, 下载次数: 36

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2019-5-22 21:24 | 显示全部楼层
excel_hero 发表于 2019-5-21 22:32
验证了下, 确实可行.

不过两边的双引号无需提取出来, 有逗号作为分隔开就够了. 我尝试着用

不需要保留的特征字符,放在括号外:
.*?:"([^"]*)"}|.+

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-5-23 09:13 | 显示全部楼层
ggmmlol 发表于 2019-5-22 21:24
不需要保留的特征字符,放在括号外:
.*?:"([^"]*)"}|.+

此时刚刚测试了下, 完美无误, 真是强大!

谢谢!!!
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-23 14:29 , Processed in 0.038091 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表