ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 9032|回复: 12

[分享] 对数据模糊匹配或相似度匹配函数公式的一点改进

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-6-15 08:16 | 显示全部楼层 |阅读模式
本帖最后由 yjgsz 于 2019-6-15 19:15 编辑

原贴:http://club.excelhome.net/thread-1048885-1-1.html
首先要感谢原帖中胡剑0227版主这个功能强大的公式。
   工作中常常碰到需要比对两列数据的情形,如表格中有两列数据(单位名称),但存在两列中不同的名称实际上就是同一家单位的情况,比如同一酒店,其中一列的名字为“杭州开元名都大酒店”,而另一列的名字为“开元名都酒店”。此外,还存在另一列中有多个名称,如开元名都大酒店、开元名都大酒店(XX路分店)、开元名都大酒店(XX路店)等,因此需要模糊比对。

因同事在工作中正好遇到了类似问题,向我求助,而我只好到excelhome来寻求帮助了(好长时间没登陆了)。
一番搜索,发现了上面这个帖子,如获至宝(计算量有点大)。
经过学习消化,我将“经字符出现率调制”名称公式改为:
经字符出现率调制=IF(ISERROR(字符出现标记/字符长度),0,字符出现标记/字符长度)

原公式=IF(ISERROR(字符出现标记/MMULT(TRANSPOSE(ROW(INDIRECT("1:"&ROWS(原数据)))^0),字符出现标记)),0,字符出现标记/MMULT(TRANSPOSE(ROW(INDIRECT("1:"&ROWS(原数据)))^0),字符出现标记))

之后,再次改进为:
=IF(ISERROR(字符出现标记/字符长度),0,字符出现标记/(字符长度-字符关联长度+1))
即将 “字符出现标记/字符长度” 改为 “字符出现标记/(字符长度-字符关联长度+1)”

最后,为解决“杭州金马饭店”会匹配杭州金马饭店(分店)的情况,
针对有多个单位匹配权值相同的情况,又改进公式选取字符数最少的单位。

一是在一定程度上减少了计算量,加快了速度。
二是统一了不同关联长度下的比对强度(精度),从单字到多字关联,精度统一。
实际应用中大大减少了调试不同关联长度和比对强度来得到想要结果的做法。
一般情况下 ,关联长度2,比对强度0.5就够了。
三是解决了多单位选取的问题。

同时,在理解上,也更接近传统意义。比对强度为1,就是百分之百一样。
如用“字符出现标记/字符长度” ,哪怕百分之百一样,
不同字符关联长度,比对强度要设置不同,关联越多,强度要设得越低。
用“字符出现标记/(字符长度-字符关联长度+1)”,解决了这个问题,不同关联长度下,比对强度设定不变。

如“杭州宏丽宾馆”,字符关联长度为1、2、3、时,
其对应的字符提取比对次数为6、5、4,即(字符长度-字符关联长度+1)。

测试后效果不错(原贴134楼)。

再次向胡剑0227版主致敬。


模糊匹配工具-可控关联字符数-强度统一高精度.rar

13.19 KB, 下载次数: 893

评分

3

查看全部评分

TA的精华主题

TA的得分主题

发表于 2019-7-16 15:46 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-10-10 23:30 | 显示全部楼层
这个表格样式做得真不错,很方便,现实工作中可以大大提高识别效率,感谢分享!

TA的精华主题

TA的得分主题

发表于 2020-1-19 23:35 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2020-3-31 23:31 | 显示全部楼层
大佬你好,我遇到一个很尴尬的问题,我无论复制多少数据进去,一次性只能处理22个,请问是什么原因呢?

TA的精华主题

TA的得分主题

发表于 2020-4-8 14:47 | 显示全部楼层
看了你这个我又特意看了胡剑版主的,受益匪浅!!!感谢两位!!

TA的精华主题

TA的得分主题

发表于 2020-4-8 16:39 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2020-4-8 17:02 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
挺好的,学习了,正在试试

TA的精华主题

TA的得分主题

发表于 2020-4-12 22:14 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2020-6-15 10:20 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-24 05:16 , Processed in 0.051923 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表