ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 8138|回复: 10

[求助] 请教如何查找并突出显示指定文档的相同内容?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2012-7-11 12:09 | 显示全部楼层 |阅读模式
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
http://club.excelhome.net/thread-358299-1-1.html中,我曾问过“如何批量查找(删除)相同的内容”的问题,该问题是针对同一文档;而不适用于不同的文档;今天新开此帖寻求解题的VBA方法:
请教如何查找并标注出指定文档的相同内容?
在同一文档或指定目录下的指定文档中,有些题目在该文档或不同的文档中是重复出现的;请教如何批量查找这些重复的内容并将其用红字字体进行突出显示?
所说的相同内容可以说是绝大多数字符是相同的(其序号可以是相同的,也可以是不同的;空格,标点等细微不同等也可以忽略不计),分为以下情况:
1、在同一文档中,单项选择题中的第1,5,8小题就是相同的内容;第9和第10小题也是相同的,这样我们就将第5,8,10小题突出显示
2、在同一文档中,在第二大题中,第1,7小题内容相同;第3,10小题内容相同,在查找出相同内容以后,将第7小题和第10小题内容突出显示
3、对于不同文档出现相同的内容,也是按上述方法进行突出显示


该贴已经同步到 tangqingfu的微博

测试文档.zip

3.05 KB, 下载次数: 42

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-5-10 14:31 | 显示全部楼层
翻出旧帖,希望能有高人指点,帮写个查找并突出显示活动文档的相同或相似内容的代码?

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-5-11 08:16 | 显示全部楼层
看过前版主守柔在本版曾贴过一下“Word文本筛”的图片,是用于文档重复段落和相似段落的分析工具,可惜无下载地址,不知哪位有这样的工具或能写出这样的功能?

TA的精华主题

TA的得分主题

发表于 2013-5-14 07:56 | 显示全部楼层
本帖最后由 zhanglei1371 于 2013-5-14 08:00 编辑

抛砖引玉:先提供一个思路:
首先按段落循环,将每段分为等长的三部分,然后以每一部分为关键字查找,找到后将关键字所在段内容赋予一个变量,若三部分关键字找到的内容有两部分都对应同一段落,则选定该段落,增加编辑区域。反复循环即可。
若要更精确可分为更多的部分进行查找。
各位若有更好的思路不妨提供出来,有思路就可转化为代码……

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-5-14 08:06 | 显示全部楼层
zhanglei1371 发表于 2013-5-14 07:56
抛砖引玉:先提供一个思路:
首先按段落循环,将每段分为等长的三部分,然后以每一部分为关键字查找,找到 ...

无力解决此问题,能否请张兄帮写个代码?
守版的Word文本筛参见:
http://club.excelhome.net/forum.php?mod=viewthread&tid=414999

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-5-14 08:29 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
zhanglei1371 发表于 2013-5-14 07:56
抛砖引玉:先提供一个思路:
首先按段落循环,将每段分为等长的三部分,然后以每一部分为关键字查找,找到 ...

回过头看,筛选出文档中具有重复的段落(内容),或者相似(相近的)段落(内容),主要还是用于解决活动文档的情况,张兄可以此方向展开思路,可以参考sylun兄的回复或代码
http://club.excelhome.net/thread-358299-1-1.html

TA的精华主题

TA的得分主题

发表于 2013-5-14 14:59 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
将sylun的修改下可以得到选中内容:
Sub test()
'引用Microsoft VBScript Regular Expressions 5.5
Dim mytext As String, myExp As New RegExp, myMatches
Dim i As Integer, c As Integer, mystart As Long, myend As Long, myRange As Range, deltext As String
Application.ScreenUpdating = False
mytext = ActiveDocument.Content
With myExp
    .Pattern = "^(\t.+\r)(.+?)(\1)"  '第一个问题的搜索模式
    .Global = True
    .MultiLine = True
    Do  '处理第一个问题,以答案内容(假设均以制表符开头)重复为线索
        Set myMatches = .Execute(mytext)
        If myMatches.Count = 0 Then Exit Do
        For i = myMatches.Count - 1 To 0 Step -1
           c = c + 1
           mystart = myMatches(i).FirstIndex + myMatches(i).Length - Len(myMatches(i).SubMatches(2))
           myend = myMatches(i).FirstIndex + myMatches(i).Length
           Set myRange = ActiveDocument.Range(mystart, myend)
           myRange.MoveStart wdParagraph, -1
                      myRange.Select
                      If myRange.Editors.Count > 0 Then Exit Do
                      Selection.Editors.Add wdEditorEveryone

           mytext = ActiveDocument.Content
        Next
    Loop
    .Pattern = "([\r\t]+\d+\.)(.+?)(\s?[\t\r].+?)(\d+\.\s?\2)"  '第二个问题的搜索模式
    Do  '处理第二个问题
        Set myMatches = .Execute(mytext)
        If myMatches.Count = 0 Then Exit Do
        For i = myMatches.Count - 1 To 0 Step -1
           c = c + 1
           mystart = myMatches(i).FirstIndex + myMatches(i).Length - Len(myMatches(i).SubMatches(3))
           myend = myMatches(i).FirstIndex + myMatches(i).Length
             ActiveDocument.Range(mystart, myend).Select
             If Selection.Editors.Count > 0 Then Exit Do
              Selection.Editors.Add wdEditorEveryone
           mytext = ActiveDocument.Content
        Next
    Loop
End With
    ActiveDocument.SelectAllEditableRanges wdEditorEveryone
    ActiveDocument.DeleteAllEditableRanges wdEditorEveryone
Application.ScreenUpdating = True
End Sub
但只能用于相似度非常高的情况,不高的话没法使用。
八楼的代码我看过了。因为使用了替换。所以变成了文本。以我的水平目前还修改不好,只能期待守柔的文本筛来解决了。。。

TA的精华主题

TA的得分主题

发表于 2013-5-14 15:01 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
对于附件中的选择题部分,用这个也可以处理
Sub 查找相似选择题()    '
    On Error Resume Next
    Application.ScreenUpdating = False
    For Each a In ActiveDocument.Range.Paragraphs
        If a.Range.Editors.Count > 0 Then GoTo aaa:
        a.Range.Select
        Selection.EndKey
        b0 = Mid(a, Len(a) / 4, Len(a) / 3)    '对选取内容进行分段,为下面的查找关键字准备
        c0 = Right(a, Len(a) / 3)
        d0 = Mid(a, Len(a) * 2 / 3, Len(a) / 4)
        If Len(a) < 10 Then GoTo aaa:
        With Selection.Find
            .Text = c0
            .Wrap = wdFindStop
            .MatchWildcards = True
            .Forward = True
            If .Execute = False Then
                .Text = b0
            Else
                .Parent.Collapse
                Do While .Execute
                    .Parent.Bookmarks("\para").Select
                    If Selection.Find.Execute(b0) Or Selection.Find.Execute(d0) Then
                        .Parent.Bookmarks("\para").Select
                        Selection.Editors.Add wdEditorEveryone
                    End If
                    Selection.Collapse wdCollapseEnd
                    If ActiveDocument.Range.End - Selection.End < 3 Then GoTo aaa:
                Loop
            End If
        End With
aaa:
    Next
    ActiveDocument.SelectAllEditableRanges wdEditorEveryone
    ActiveDocument.DeleteAllEditableRanges wdEditorEveryone
    Application.ScreenUpdating = True
End Sub
因为是按照段落拆分的,所以填空就不行了,哈哈哈

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-5-14 17:32 | 显示全部楼层
zhanglei1371 发表于 2013-5-14 14:59
将sylun的修改下可以得到选中内容:
Sub test()
'引用Microsoft VBScript Regular Expressions 5.5

谢谢张兄!
本楼的代码能够处理选择题与填空题,但在查找的准确性上不如8楼的代码。
能否将代码改为如果有选取区域,则只对选取区域进行处理,否则作全文处理,对于重复的内容按红色进行标注。

TA的精华主题

TA的得分主题

 楼主| 发表于 2013-5-14 17:34 | 显示全部楼层
zhanglei1371 发表于 2013-5-14 15:01
对于附件中的选择题部分,用这个也可以处理
Sub 查找相似选择题()    '
    On Error Resume Next

辛苦张兄了!
本楼的代码能够处理选择题,且在查找的准确性上高于7楼的代码;但不能处理填空题的情况!
能否将代码改为如果有选取区域,则只对选取区域进行处理,否则作全文处理,对于重复的内容按红色进行标注。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2025-1-16 02:38 , Processed in 0.028019 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表