ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 2782|回复: 12

[求助] 用什么方法快速实现名称模糊匹配填充

[复制链接]

TA的精华主题

TA的得分主题

发表于 2020-6-8 16:59 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
”表1“ 表中的 B列模糊匹配 “数据“ 表中的 B列,然后在”表1“表的 A列上填充“数据“ 表中的 A列数据。绿色标注的是最后呈现的结果。


部分匹配填充.zip

30.67 KB, 下载次数: 22

TA的精华主题

TA的得分主题

发表于 2020-6-9 09:35 | 显示全部楼层
image.png 匹配效果不太好,具体方法是:做一个计算两个字符串相似度的function,然后设置一个相似度阈值(我设置的是0.3),最后循环判断就行。相似度计算的算法比较多,主要有:最长公共字串(在这里效果应该不太好),最小编辑距离等方法,也可以试试将两字符串转成字符数组,然后计算两个数组的交集大小来计算相似度

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-6-9 12:02 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
iris_2356 发表于 2020-6-9 09:35
匹配效果不太好,具体方法是:做一个计算两个字符串相似度的function,然后设置一个相似度阈值(我设置的是 ...

能把修改的附件发我参考一下吗?

TA的精华主题

TA的得分主题

发表于 2020-6-9 14:19 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
相似度比较低的可能有误配的情况 image.png

部分匹配填充.zip

41.38 KB, 下载次数: 51

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-6-9 14:53 | 显示全部楼层
iris_2356 发表于 2020-6-9 14:19
相似度比较低的可能有误配的情况

是的,0.5以下都是误配的~,这样情况数据多也没有办法一一检查。

TA的精华主题

TA的得分主题

发表于 2020-6-9 18:19 来自手机 | 显示全部楼层
iris_2356 发表于 2020-6-9 14:19
相似度比较低的可能有误配的情况

是的,相似度低的的确麻烦,只能列出来
Screenshot_2020-06-09-18-17-17.png
Screenshot_2020-06-09-17-29-50.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-6-10 10:08 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2020-6-12 10:12 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
真没有能完美解决的吗?

TA的精华主题

TA的得分主题

发表于 2020-6-12 11:22 来自手机 | 显示全部楼层
liuhans 发表于 2020-6-12 10:12
真没有能完美解决的吗?

个人感觉能够这样清洗一下已经相当的完美了。。。

TA的精华主题

TA的得分主题

发表于 2020-6-12 16:22 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
liuhans 发表于 2020-6-12 10:12
真没有能完美解决的吗?

我写的相似度计算只是最简单的一种,仅供参考使用,你可以做进一步的优化啊,这个相似度计算完全没有考虑语序,你可以将语序也考虑进去;还有,每个字的权重也都一样,你可以给一些比较重要的字或词分配一些比较高的权重,常用字或词(比如:有限公司,有限责任公司)分配一个比较低的权重,通过这种方法来调节相似度,提高匹配精准率,这种模糊匹配没有完美的解决方法,只有更优化的方法,需要多动脑子才行啊。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-3-29 00:54 , Processed in 0.052993 second(s), 10 queries , Gzip On, Redis On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表