ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 5996|回复: 15

[求助] 如何在整个工作簿中自动查询三个字以上重复出现的字、词、句

[复制链接]

TA的精华主题

TA的得分主题

发表于 2018-4-23 12:02 | 显示全部楼层 |阅读模式
本帖最后由 ya3166 于 2018-4-23 12:05 编辑

大智度论.rar (1.32 MB, 下载次数: 8)

问题:
我需要从100多个word文档里,自动比对出重复出现两次以上的字、词、句,尝试很多种方式,后来发现VBA可能可以解决这个问题,所以我把文章拷贝到Excel表格里,各位大神是否可以帮忙看看如何实现呢?

附件里我传了其中一个工作簿:

工作簿截图

工作簿截图


需求:
从类似这样的工作簿里,自动检索出重复出现两次以上的字、词、句子、段落

返回结果:
重复的字段以及这个字段出现的工作表名字

比如:
自动对比出“阿罗汉比丘,诸漏已永尽,”在《大智度论1》这个工作表中出现了两次,然后返回“阿罗汉比丘,诸漏已永尽,”这几个字在统计表中,并且标准其重复出现的所有地方的工作表的名称。
下面的几个是我随意做的几个示例。

返回结果截图

返回结果截图


不知道这样的问题是否可以通过VBA解决呢?

TA的精华主题

TA的得分主题

发表于 2018-4-24 09:30 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
请见附件。

大智度论.rar

1.33 MB, 下载次数: 80

TA的精华主题

TA的得分主题

发表于 2018-4-23 13:25 | 显示全部楼层
鼠标左键点击A列搜索关键词即可。
A列放关键词。
请见代码。
2018-4-23关键词.png

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-4-23 13:58 | 显示全部楼层
蓝桥玄霜 发表于 2018-4-23 13:25
鼠标左键点击A列搜索关键词即可。
A列放关键词。
请见代码。

谢谢老师的回复!
现在是重复的字词是未知的,需要通过比对把他们提取出来,这一步如何实现呢?

TA的精华主题

TA的得分主题

发表于 2018-4-23 15:42 | 显示全部楼层
如何手动提取关键字?楼主 ,这个需要你作解释、说明才对哦!

TA的精华主题

TA的得分主题

发表于 2018-4-23 16:00 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-4-23 16:29 | 显示全部楼层
zopey 发表于 2018-4-23 15:42
如何手动提取关键字?楼主 ,这个需要你作解释、说明才对哦!

就是在这100个文档当中,有很多词组或者句子是重复的,第一步是我需要通过一个方法(或者是您说的文本比较算法?),把这些重复出现的字词提取出来。
下一步把这个作为关键字,去提取这些关键字出现在哪个文档的什么位置,我可以去这个文档中找到它。
不知道我是否描述清楚?

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-4-23 16:33 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

刚才查了一下比较算法,它主要是针对文本两个类似内容的文本吧?不知道我的情况是否适用,我这个一百篇文档彼此都是不一样的,只是某一些词组或者字句是一样的,我需要把这些一样的内容找出来

TA的精华主题

TA的得分主题

发表于 2018-4-23 17:24 | 显示全部楼层
重复字词的 自动提取:
1、英文单词简单点,可以用空格区分;
2、中文字词 怎么拆分,头大,怎么比较(估计会用到哈希表)。

你手动提取,尽量多提重复的字词。以便测试 寻找规律

TA的精华主题

TA的得分主题

 楼主| 发表于 2018-4-23 23:37 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 ya3166 于 2018-4-24 07:20 编辑
蓝桥玄霜 发表于 2018-4-23 13:25
鼠标左键点击A列搜索关键词即可。
A列放关键词。
请见代码。

蓝老师,谢谢您的回复!现在关键字我已经手工提取了一部分,我刚开始学习VBA,不太明白这个代码怎么用,是在大智度论这个工作簿中再新建一个新的工作表,把我提取出来的关键字这个新工作表中,然后在这个工作表中运行您给的这个代码吗?代码需要我再修改什么地方吗?

您给我的代码是:
Private Sub Worksheet_SelectionChange(ByVal Target As Range)
If Target.Count > 1 Then Exit Sub
If Target.Column <> 1 Or Target.Row < 2 Then Exit Sub
If Target = "" Then Exit Sub
Dim Sht As Worksheet, gjc$, m&, col%, r1
m = Target.Row: col = 2
gjc = Target.Value
Cells(m, 3).Resize(1, 100).ClearContents
For Each Sht In Sheets
    If Sht.Name <> Sheet1.Name Then
    Set r1 = Sht.Cells.Find(gjc, , , 2)
    If Not r1 Is Nothing Then
        col = col + 1
        Cells(m, col) = Sht.Name
    End If
    End If
Next
End Sub

TA的精华主题

TA的得分主题

发表于 2018-4-24 09:21 | 显示全部楼层
Find函数 等于工作表的 “查找”ctrl+f,,可以定位。
我觉得主要问题还是在于 自动提取出重复的字词。
不知道手动 提取了多少个?(字数要求)
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

关闭

最新热点上一条 /1 下一条

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-4-26 20:26 , Processed in 0.044706 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表