ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 胡剑0227

[原创] 数据模糊匹配或相似度匹配函数公式实现及思路解析

  [复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-9-25 10:59 | 显示全部楼层
本帖已被收录到知识树中,索引项:数据查询和匹配
Ron2000 发表于 2013-9-18 13:27
胡版主,太厉害了,工作中经常遇到类似的问题,原理不太懂,用着费劲,能否做成自定义函数,如Fuzzyvlookup ...

自定义函数不在行呀,呵呵

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-9-25 11:01 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
82876597 发表于 2013-9-18 13:51
胡版利害,要好好收藏起来理解

思路简单的,技术上的难度就是MMULT按行汇总和MMULT按列汇总...

点评

数据多了运算速度也是个问题  发表于 2013-9-25 14:27

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-9-25 15:29 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
胡剑0227 发表于 2013-9-25 11:01
思路简单的,技术上的难度就是MMULT按行汇总和MMULT按列汇总...

是的,问题还是蛮大的

TA的精华主题

TA的得分主题

发表于 2013-9-27 13:19 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
希望胡大神出书或出视频系统讲解一下数组公式的应用

TA的精华主题

TA的得分主题

发表于 2013-9-29 16:08 | 显示全部楼层
太厉害了,要是做成VBA就更棒了!

TA的精华主题

TA的得分主题

发表于 2013-10-4 13:25 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2013-10-4 15:32 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2013-10-4 18:57 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2013-11-11 13:40 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
本帖最后由 tan133 于 2013-11-11 13:44 编辑

一不小心进了这儿,才发现,居然夜间不能回复,好吧,我承认是为了我们的身体健康
我想说的有几点
有一个算法,叫编辑距离,这玩意,应该属于这范畴
不过,编辑距离只是取一个词到另一个词的编辑修改次数,似乎不怎么有效
那另一个,就是要要考虑字或者词的权重
我个人的看法是,越不常用的字或词的权重越高,
按同一个字的权重相当,这个字出现得越多,平均下来每个字占的权重就应该越少,
比如,共有10个字,其中A出现了3次,B出了2次,C出了5次
那么,ABC所有的在一起,各占三分之一,具体下来,
每个A占三分之一的三分之一,每个B则是三分之一的二分之一,每个C则是三分之一的五分之一
可是,好象不是这么算的
四川省的省,和反省的省,貌似权重肯定不一样
另外,有一个叫什么GOOGLE的公司,有两个工程师,用了什么空间向量来表达不同语言,试图找到不同语言间的相同点,似乎也可以借来一用,不过,我不懂空间向量
你这个属于人工智能的范畴了,我感觉,应该建立在大量分析的基础上,对词进行拆,不是一定要一个或者两个或者三个字,而是应该按人们正常的阅读顺序来拆成一个一个的词(可以是任意个字数),在同义词替换后,按权重来,这个工作,做下来,我觉得,可能,大概,也许,设计好后,准确率倒是可以上去,可是,就算是1000个数据与1000个数据找对应,也费时得很的吧?
不知道,如果建立数据库,把常用的近义词汇个总,然后,对不同义的词给一个权重,会不会好一些
这些,我会瞎说,不会写,如果说错了,不要怪我啊,版版做的是千秋万代有利的事业,值得研究

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-11-11 15:08 | 显示全部楼层
tan133 发表于 2013-11-11 13:40
一不小心进了这儿,才发现,居然夜间不能回复,好吧,我承认是为了我们的身体健康
我想说的有几点
有一个 ...

呵呵,这些只是用来应付日常资料工作的需要,只是比人工比对好一些,太专业的我也不是很懂,呵呵
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-27 02:04 , Processed in 0.042285 second(s), 7 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表