ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 胡剑0227

[原创] 数据模糊匹配或相似度匹配函数公式实现及思路解析

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2019-2-11 10:02 | 显示全部楼层
本帖已被收录到知识树中,索引项:数据查询和匹配
谢谢楼主分享,太强了!!

TA的精华主题

TA的得分主题

发表于 2019-2-19 12:43 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
谢谢楼主分享,太强了!!

TA的精华主题

TA的得分主题

发表于 2019-3-9 20:12 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 yjgsz 于 2019-3-11 16:59 编辑

因同事在工作中正好遇到了类似问题,向我求助,而我只好到excelhome来寻求帮助了(好长时间没登陆了)。
一番搜索,发现了版主的这个帖子,如获至宝(计算量有点大)。
经过学习消化,我将“经字符出现率调制”名称公式改为:
经字符出现率调制=IF(ISERROR(字符出现标记/字符长度),0,字符出现标记/字符长度)

原公式=IF(ISERROR(字符出现标记/MMULT(TRANSPOSE(ROW(INDIRECT("1:"&ROWS(原数据)))^0),字符出现标记)),0,字符出现标记/MMULT(TRANSPOSE(ROW(INDIRECT("1:"&ROWS(原数据)))^0),字符出现标记))

之后,再次改进为:
=IF(ISERROR(字符出现标记/字符长度),0,字符出现标记/(字符长度-字符关联长度+1))
即将 “字符出现标记/字符长度” 改为 “字符出现标记/(字符长度-字符关联长度+1)”

最后,为解决“杭州金马饭店”会匹配杭州金马饭店(分店)的情况,
针对有多个单位匹配权值相同的情况,又改进公式选取字符数最少的单位。

一是在一定程度上减少了计算量,加快了速度。
二是统一了不同关联长度下的比对强度(精度),从单字到多字关联,精度统一。
实际应用中大大减少了调试不同关联长度和比对强度来得到想要结果的做法。
一般情况下 ,关联长度2,比对强度0.5就够了。
三是解决了多单位选取的问题。

同时,在理解上,也更接近传统意义。比对强度为1,就是百分之百一样。
如用“字符出现标记/字符长度” ,哪怕百分之百一样,
不同字符关联长度,比对强度要设置不同,关联越多,强度要设得越低。
用“字符出现标记/(字符长度-字符关联长度+1)”,解决了这个问题,不同关联长度下,比对强度设定不变。

如“杭州宏丽宾馆”,字符关联长度为1、2、3、时,
其对应的字符提取比对次数为6、5、4,即(字符长度-字符关联长度+1)。

测试后效果不错。

向版主学习,请多指教。


模糊匹配工具-可控关联字符数-强度统一高精度.rar

13.19 KB, 下载次数: 299

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2019-3-12 20:19 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
谢谢楼主分享,太强了!!

TA的精华主题

TA的得分主题

发表于 2019-3-13 07:06 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
强大.............

TA的精华主题

TA的得分主题

发表于 2019-3-24 00:00 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-4-3 23:14 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
胡剑0227 发表于 2013-8-22 16:43
【基本思路】 既然不规则,那么分析某比对数据(比如“莫泰连锁酒店(孙权路店)”,记为【A1】)的各个字符 ...

胡版主,你好,最近我工作上也需要用到你2樓所舉例子的情況,我也賞試過將你列舉的各小公式合成一條公式,在一個單元格中,但報錯了,請問能否回復我,將你的各小公式合成一條公式,應如何表達,謝謝你

TA的精华主题

TA的得分主题

发表于 2019-4-9 17:39 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
谢谢胡版分享,太强大!!

TA的精华主题

TA的得分主题

发表于 2019-4-12 17:15 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2019-5-6 18:25 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-15 14:50 , Processed in 0.046204 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表