ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: shanchuan

[讨论] 字符相似度比较的问题--经典模式

[复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2010-8-7 00:45 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册

呼唤VBA侠圣和专家

目前基本都是函数方法的解答,非常复杂;呼唤VBA侠圣和专家前来展现VBA方法的风采

TA的精华主题

TA的得分主题

 楼主| 发表于 2010-8-8 03:37 | 显示全部楼层
重新整理了题目要求和附件。方便预览

TA的精华主题

TA的得分主题

 楼主| 发表于 2010-8-8 11:06 | 显示全部楼层
原帖由 wangjguo44 于 2010-7-23 13:57 发表
增加一个相同名称含相同字符80%以上的标志。(本行与上行或本行与下行80%相同以上为1,虽上行与本行有80%相同,但本行与上行没有到80%也不标,本行与下行也如此,如51行)(公式4已做去不可见字符处理)

2010-08-08补充:以上虽然实现上下行互相比较,但还是局限性很大,能否在B列名称相同的时候,把C列内容的重复(不一定是完全相同。标准可以设置为有80%的字符一样,或者相同字符数超过10个)次数大于等于3的标记出来。

TA的精华主题

TA的得分主题

 楼主| 发表于 2010-8-8 21:35 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
闲之辈
时而举
世之才
到擒来
前目后凡   
来之不易
解疑释惑
题终能解?

[ 本帖最后由 shanchuan 于 2010-8-8 22:01 编辑 ]

TA的精华主题

TA的得分主题

发表于 2010-8-8 21:45 | 显示全部楼层
其实楼主这个应该统一不合格描述的规范用语的,或者给出诸多不合格描述的代码,然后才好用程序来判断,否则的话,除非人工智能能达到人脑的级别

TA的精华主题

TA的得分主题

 楼主| 发表于 2010-8-8 21:57 | 显示全部楼层
原帖由 kevinchengcw 于 2010-8-8 21:45 发表
其实楼主这个应该统一不合格描述的规范用语的,或者给出诸多不合格描述的代码,然后才好用程序来判断,否则的话,除非人工智能能达到人脑的级别



不求完美   不求能100%识别
但求更佳   准确率越高越好

TA的精华主题

TA的得分主题

发表于 2010-8-8 23:21 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
这个问题不在有多难,而在于标准如何定。
如何有效判断“相似”?
何为相似?
相似的标准有了,结果就有了。

TA的精华主题

TA的得分主题

 楼主| 发表于 2010-8-9 02:05 | 显示全部楼层

欢迎探讨如何来定义“相似”的标准

原帖由 cafkyy 于 2010-8-8 23:21 发表
这个问题不在有多难,而在于标准如何定。
如何有效判断“相似”?
何为相似?
相似的标准有了,结果就有了。


欢迎探讨如何来定义“相似”的标准:
我现在的做法是:
1、字符比较(含相同字符80%)
2、字符特征 (根据问题分类包含的字符特征,如“硬度”等)
3、结合以上两条考虑,以字符特征为主(人脑就是这么判断的),字符比较为辅(作为没有设立字符特征的项目的补充)。
效果:大约80%的问题设立了“字符特征”,可100% 筛选出来;“字符比较”定义80%,还是有很多不能筛选出来或者多筛选出来。经过验证,和人脑相比200批能有加减30批的误差,误差率15%--20%。
这可以印证2个问题,一是如果能考虑所有的字符特征(目前是不可能的) 准确率将接近100%;字符比较方法公式尚有不足。

[ 本帖最后由 shanchuan 于 2010-8-9 02:09 编辑 ]

TA的精华主题

TA的得分主题

 楼主| 发表于 2010-8-9 12:42 | 显示全部楼层

发现了一个删除包含指定字符列的求助帖

Sub fd()
For i = [iv1].End(xlToLeft).Column To 1 Step -1
If Cells(1, i).Value Like "*调拨*" Then Columns(i).Delete
Next
End Sub

可以用来参考用来做标记含有指定字符的列。

TA的精华主题

TA的得分主题

发表于 2010-8-9 15:19 | 显示全部楼层
E2=IF(SUM((MMULT(1*ISNUMBER(FIND(MID(C2&REPT("%",20),COLUMN(A:Z),3),$C$2:$C$47)),ROW($1:$26)^0)>2)*($A$2:$A$47=A2)*($B$2:$B$47=B2))>2,C2,"")
其中红色2是相似度,改大则相似度高,反之小。
不知是否有用??

单元格重复字符数1.rar

42.33 KB, 下载次数: 77

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-23 23:53 , Processed in 0.032889 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表