ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 4923|回复: 6

[求助] 两列根据相同字符占比,按照相似度模糊匹配的问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-6-24 17:59 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
两列根据相同字符占比,按照相似度模糊匹配,按照最相似的为同一行。
Power Query如何做查询?

模糊匹配两列(根据相同字符的占比)201806.rar

48.1 KB, 下载次数: 178

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-6-24 18:00 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2018-6-27 09:09 | 显示全部楼层
总体来说,用Power Query实现并不难,但对于大多数情况下,用相同字数的多少来匹配的效果并不是很好,但你这个也许可以试试,可以参考我的这篇小文章:
杂乱文本按”相似度“进行匹配

评分

2

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-2 13:57 | 显示全部楼层
Power Query貌似没成功,请问哪个环节出错了?

re_Power Query模糊匹配两列(根据相同字符的占比匹配到行)201806(自编).rar

59.75 KB, 下载次数: 22

TA的精华主题

TA的得分主题

发表于 2018-7-2 19:05 | 显示全部楼层
wmj1999 发表于 2018-7-2 13:57
Power Query貌似没成功,请问哪个环节出错了?

对两表做合并不是添加索引列并用索引列做匹配,而是建一个内容都是“1”(或任何字符)的自定义列做匹配(或参考我另一篇文章:构建两表全部组合的极简方法)。

TA的精华主题

TA的得分主题

发表于 2018-7-2 19:35 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
       我仔细看了你做的步骤,大概有以下两个方面的问题:
  • 生成两表全匹配关系用的是索引列,而应该用一个内容全部为一样的列;
  • 分组的时候不应聚合所有行(我那个例子里面是用来得到所有组合的相似度,而且两个表的数据只有一列,可以那么做),那样得到的是每个分组(你表一的项目)对应的所有行(表二)以及索引列的所有行,两次展开后数据会进一步重复。而应该通过求和的方式聚合你所要的列以生成分组的代码,然后将代码中的List.Sum(求和)函数改为List.First(取第一行即相似度最高的行)——关于分组依据类似的操作方法,可以先参考我的文章《动态分组合并同类项》,理解了分组的操作原理之后,再来根据实际需要应用。

      我在你做的查询基础上修改了一下,详细请看附件。

re_模糊匹配两列(根据相同字符的占比匹配到行)201806(自编).rar

62.64 KB, 下载次数: 155

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-7-4 16:20 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 wmj1999 于 2018-7-4 21:07 编辑

List.Count([交叉])/List.Average({List.Count([原名称]),List.Count([对比名称])}),Average匹配最佳。附件打开后第一次刷新报错,但是在查询编辑器中刷新均不报错,隐私设置已检查!不知为何???

re2_主楼结构--二期二南区两咨询项目特征对比(委托)--20180704.rar

22.05 KB, 下载次数: 20

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-20 23:49 , Processed in 0.045058 second(s), 17 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表