ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: 13907933959

[求助] 用VBA一次查找到文档中各不相同的重复句子、并用红色标识

[复制链接]

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-8-9 11:28 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

前辈好!
好像不成,请看重新上传的附件!

新模拟附件.rar

8.9 KB, 下载次数: 15

TA的精华主题

TA的得分主题

发表于 2016-8-9 11:35 | 显示全部楼层
13907933959 发表于 2016-8-9 11:28
前辈好!好像不成,请看重新上传的附件!

标红你所谓的“重复句子”。好不好?

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-8-9 11:39 | 显示全部楼层
duquancai 发表于 2016-8-9 11:35
标红你所谓的“重复句子”。好不好?

前辈的意思是???

TA的精华主题

TA的得分主题

发表于 2016-8-9 11:48 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-8-9 12:05 | 显示全部楼层

前辈好!
刚才看了您录制的视频,我用也一样有哪个效果,怪我没说清楚,我的意思是说:附件上有十几种不同的相同的重复句子,而每个相同的重复句子又有5~10几句不等,凡是有相同的重复句子全部标为红色,而您给的代码好像只能标注一部分的重复句子。
重复的段落也如上一样。
另外、重复句子的前后都有不同的标点符号。

TA的精华主题

TA的得分主题

发表于 2016-8-9 12:48 | 显示全部楼层
本帖最后由 duquancai 于 2016-8-9 14:39 编辑
13907933959 发表于 2016-8-9 12:05
前辈好!
刚才看了您录制的视频,我用也一样有哪个效果,怪我没说清楚,我的意思是说:附件上有十几种不 ...

请测试下面的代码:
  1. Sub shishi()
  2.     Dim rngtxt As Range, rg As Object, mt, dic As Object, ky
  3.     Dim mh, m&, n&, oRang As Range
  4.     Set rngtxt = ActiveDocument.Content
  5.     Set dic = CreateObject("Scripting.Dictionary")
  6.     Set rg = CreateObject("VBScript.Regexp")
  7.     On Error Resume Next
  8.     With ActiveDocument
  9.         rg.Global = True
  10.         rg.Pattern = "[^。!?:,、;\r]+?(?=[。!?:,、;])"
  11.         For Each mt In rg.Execute(rngtxt)
  12.             dic(mt) = ""
  13.         Next
  14.         For Each ky In dic.Keys
  15.             rg.Pattern = ky & "(?=[。!?:,、;])"
  16.             If rg.Execute(rngtxt).Count >= 2 Then
  17.                 For Each mh In rg.Execute(rngtxt)
  18.                     m = mh.FirstIndex: n = mh.Length
  19.                     Set oRang = .Range(m, m + n)
  20.                     oRang.Font.ColorIndex = 6
  21.                 Next
  22.             End If
  23.         Next
  24.     End With
  25. End Sub
复制代码


TA的精华主题

TA的得分主题

 楼主| 发表于 2016-8-9 17:09 | 显示全部楼层
本帖最后由 13907933959 于 2016-8-9 17:17 编辑
duquancai 发表于 2016-8-9 12:48
请测试下面的代码:

前辈好!
下午师傅的诊所里来了几个病人,所以到刚刚才测试,附件上的相同的重复句子,重复段落可准确全部标为红色。
可我在另一个附件上(见附件2)测试,结果却不太理想,如:“寿世传真”…等,可能是前辈的代码具有针对性。
因我有很多文档里面有要删除的重复的句子、段落,它们每个都不太一样,能不能再劳前辈编写一个具有广普性,适应不同的Word文档的,查找这种重复的句子、段落的代码,锁定的标准为一句完整的句子,而不是一部分,也就是整句相同的。(重复的句子、段落,前后同样是有不同的标点符号)只要是这种重复的就标为红色。

附件2.rar

17.06 KB, 下载次数: 12

TA的精华主题

TA的得分主题

发表于 2016-8-9 18:21 | 显示全部楼层
本帖最后由 duquancai 于 2016-8-9 18:30 编辑
13907933959 发表于 2016-8-9 17:09
前辈好!下午师傅的诊所里来了几个病人,所以到刚刚才测试,附件上的相同的重复句子,重复段落可准确全部 ...

我现在才发觉我的写的正则表达式是多么的奇怪  哎!!!
  1. Sub shishi()
  2.     Dim rngtxt As Range, rg As Object, mt, dic As Object, ky
  3.     Dim mh, m&, n&, oRang As Range
  4.     Set rngtxt = ActiveDocument.Content
  5.     Set dic = CreateObject("Scripting.Dictionary")
  6.     Set rg = CreateObject("VBScript.Regexp")
  7.     On Error Resume Next
  8.     With ActiveDocument
  9.         rg.Global = True
  10.         rg.Pattern = "[。!?:,、;\r]([^\r]+?)(?=[。!?:,、;])"
  11.         For Each mt In rg.Execute(rngtxt)
  12.             dic(mt.SubMatches(0)) = ""
  13.         Next
  14.         For Each ky In dic.Keys
  15.             rg.Pattern = "[。!?:,、;\r]" & ky & "(?=[。!?:,、;])"
  16.             If rg.Execute(rngtxt).Count >= 2 Then
  17.                 For Each mh In rg.Execute(rngtxt)
  18.                     m = mh.FirstIndex: n = mh.Length
  19.                     Set oRang = .Range(m + 1, m + n)
  20.                     oRang.Font.ColorIndex = 6
  21.                 Next
  22.             End If
  23.         Next
  24.     End With
  25. End Sub
复制代码

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2016-8-9 19:12 | 显示全部楼层
duquancai 发表于 2016-8-9 18:21
我现在才发觉我的写的正则表达式是多么的奇怪  哎!!!

前辈好!
刚刚测试了18楼的代码,还是有部分相同就标红的现象,还是我没有表达清楚。一个标点符号到一个标点符号之间的句子(书名),要全部相同的才似为重复的句子(书名),才标红,无论句子(书名)开头、中间、结尾(不包括标点符号)有一个字不相同的就似为不是重复的句子(书名),不标红。

TA的精华主题

TA的得分主题

发表于 2016-8-9 19:17 | 显示全部楼层
13907933959 发表于 2016-8-9 19:12
前辈好!
刚刚测试了18楼的代码,还是有部分相同就标红的现象,还是我没有表达清楚。一个标点符号到一个 ...

那一句?请举例,自己认真核对吧!你自己查找吧!标红了的,都是重复了2次及以上。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-23 07:05 , Processed in 0.039358 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表