ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
12
返回列表 发新帖
楼主: yunyefeiyang

EXCEL 模糊匹配

[复制链接]

TA的精华主题

TA的得分主题

发表于 2013-5-17 12:09 | 显示全部楼层
本帖最后由 cncalyl 于 2013-5-17 12:17 编辑

楼猪说实际数据有7千多条,计算机比对不了,人工更无法比对!
  过去我曾经写过程序比对两个文件中的单位名称,单位名称不是很规范,如:××市工程机械厂与××工程机械厂、××市生产资料公司与××市生产资料有限公司、××装潢公司与××装璜公司等,虽然名称不相等,但前者与后者是同一单位。数据是8万多条,当然数据不仅仅只是单位名称,还有其他数据,欲通过单位名称将两个文件的数据桥接起来。实现思路:
  1.先分别排除两个文件中自身重复的单位,再将两个文件中单位名称关联完全一致数据的拿出去并单独存储;
  2.剩下的计算单位名称相似百分比,按相似度由高到低每单位给出20个单位,由用户人工确认;
  3.将用户确认的相同单位,赋予不可能重复的桥接名称并拿出去另行存储;
  4.再执行步骤2、步骤3,直至人工确认两个文件中无同一单位的;
  5.将名称完全相同的单位、用户人工确认的相同单位,分别追加成两个库,通过桥接名称,关联两个库实现数据桥接。
  不过楼猪也太小气了,你的数据只是两列姓名,也没有什么安全号、年龄、电话、银行卡号、住址等隐私信息,就给那么5条数据,你真是够勤俭的了,是把过日子的好手!我们朝鲜虽然穷,也不会像你这样小气!那么点数据不便归纳找寻规律,因此,帮你的网友寥若星辰。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-15 12:18 , Processed in 0.030737 second(s), 5 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表