ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1407|回复: 11

[求助] 相似文本处理问题

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-2-9 11:48 | 显示全部楼层 |阅读模式
相似文本处理问题,做个假设吧,如果两行文字有超过80%相同的话就删除其中一行。可能比较难实现,请老师赐教。具体看附件,多谢老师。 相似文本删除问题.rar (17.91 KB, 下载次数: 25)

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-9 13:51 | 显示全部楼层
看来真的有点难搞哦

TA的精华主题

TA的得分主题

发表于 2023-2-9 14:10 | 显示全部楼层
确定一个相似度值,比如80%相似的 随机保留一条可以写

TA的精华主题

TA的得分主题

发表于 2023-2-9 16:04 | 显示全部楼层
借楼主的帖子请教各位老师:文本相似度与文本字数相同数量(百分比等)应该是两个不同的概念。可以对这两个不同的概念借用楼主的例子来分别进行计算吗?网络介绍的文本相似度计算比较复杂。感谢楼主和各位老师。

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-9 16:27 | 显示全部楼层
小凡、、、 发表于 2023-2-9 14:10
确定一个相似度值,比如80%相似的 随机保留一条可以写

可以的,相似的随机保留即可

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-10 12:37 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2023-2-10 14:24 | 显示全部楼层
试试吧。。。
360截图20230210142222106.jpg

相似文本删除问题.rar

22.61 KB, 下载次数: 7

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-10 14:50 | 显示全部楼层

已经很不错了,但是如果A列的文本多复制一次接在后面的话结果就有问题了

TA的精华主题

TA的得分主题

发表于 2023-2-10 14:55 | 显示全部楼层
感觉这个要用人工智能来解决。Python可能有适合的工具。

TA的精华主题

TA的得分主题

发表于 2023-2-10 16:11 | 显示全部楼层
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-19 08:37 , Processed in 0.043802 second(s), 15 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表