ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 8424|回复: 48

[求助] 查找段落中重复药名标红并记数

[复制链接]

TA的精华主题

TA的得分主题

发表于 2019-7-26 08:45 | 显示全部楼层 |阅读模式
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 13907933959 于 2019-7-27 09:35 编辑

查找word文档段落中重复的药名,在重复的药名后面标注重复的数量,如:豺肉、共有5个,就在第一个豺肉后面标注(重复4个),后面再出现的“豺肉”就不标注了,其它段落中重复的药名以此类推。把后面的重药名标红一下,药名后面查重记了数的除外。
劳请前辈们帮忙写个代码!谢谢!

附件.rar

14.78 KB, 下载次数: 41

TA的精华主题

TA的得分主题

发表于 2019-7-26 10:21 | 显示全部楼层
试试如下代码:
  1. Sub SearchDuplicateStr()
  2.     Dim theStr$, d As Object, i&, j&, theStrTemp$
  3.     Dim reg As Object, theMatches As Object, theMatch As Variant
  4.     '
  5.     Set d = CreateObject("Scripting.Dictionary")
  6.     Set reg = CreateObject("VBScript.RegExp")
  7.     With reg
  8.         .Global = True
  9.         .MultiLine = True
  10.         .Pattern = "^[^、]+"
  11.     End With
  12.     With ActiveDocument
  13.         theStr = .Range
  14.         Set theMatches = reg.Execute(theStr)
  15.         For Each theMatch In theMatches
  16.             theStr = theMatch
  17.             d(theStr) = d(theStr) + 1
  18.         Next theMatch
  19.         reg.Global = False
  20.         theStr = .Range
  21.         For i = 0 To d.Count - 1
  22.             j = d.items()(i)
  23.             If j > 1 Then
  24.                 theStrTemp = d.keys()(i)
  25.                 reg.Pattern = "^" & theStrTemp & "、"
  26.                 theStrTemp = theStrTemp & "、(重复" & j & "个)"
  27.                 theStr = reg.Replace(theStr, theStrTemp)
  28.             End If
  29.         Next i
  30.         .Range = theStr
  31.     End With
  32.     Set theMatches = Nothing
  33.     Set theMatch = Nothing
  34.     Set d = Nothing
  35. End Sub
复制代码


评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2019-7-26 10:24 | 显示全部楼层
本帖最后由 ming0018 于 2019-7-26 15:20 编辑
  1. Sub main()
  2.     Dim doc As Document, Rng As Range, d As Object
  3.     Dim arr, i&, n%, tmpstr$
  4.     Set doc = ActiveDocument
  5.     Set Rng = doc.Content
  6.     Set d = CreateObject("scripting.dictionary")
  7.     Set reg = CreateObject("VBSCRIPT.REGEXP")    'RegEx为建立正则表达式
  8.     Application.ScreenUpdating = False
  9.     t = Timer
  10.     reg.Global = True: reg.MultiLine = True
  11.     arr = Split(Rng.Text, Chr(13))
  12.     tmpstr = Rng.Text
  13.     For i = 0 To UBound(arr)
  14.         If Len(Trim(arr(i))) > 0 Then
  15.             reg.Pattern = "^" & arr(i)
  16.             Set matchs = reg.Execute(tmpstr)
  17.             n = matchs.Count
  18.             If n > 1 Then
  19.                 If Not d.Exists(arr(i)) Then
  20.                     d(arr(i)) = ""
  21.                     doc.Range(doc.Paragraphs(i + 1).Range.End - 1, doc.Paragraphs(i + 1).Range.End - 1).Text = "(重复" & n & "个)"
  22.                 End If
  23.             End If
  24.         End If
  25.     Next i
  26.     Application.ScreenUpdating = True
  27.     Debug.Print Timer - t
  28. End Sub
复制代码

TA的精华主题

TA的得分主题

发表于 2019-7-26 11:13 来自手机 | 显示全部楼层
纯文本可以正则处理,如果不是纯文本建议用find

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-7-26 14:17 | 显示全部楼层
本帖最后由 13907933959 于 2019-7-27 07:44 编辑
gbgbxgb 发表于 2019-7-26 10:21
试试如下代码:

好久没来论坛了,我真是运气好,一来就碰到  gbgbxgb  ming0018  duquancai  3位 VBA 技术顶级的前辈赐教,万分感谢!

谢谢  gbgbxgb  ming0018  两位前辈写的代码,谢谢!

gbgbxgb前辈好!

我粗测了一下您的代码,速度上比 ming0018 前辈的要快一些,总查重药名有288个,而用 ming0018 前辈的代码,总查重药名有295个。两个查重的结果好像都不太准确。


拿“梨”、“梅”两个药材的查重来说,“梨”、查重为20个,结果错误,因只有2个。“梅”查重为2个,这个结果正确。

可能是我没讲清楚,导致您误判!“附件”中,一个段落为一个药名,也就是段落查重。


另外、前辈能不能有办法把后面的重药名标红一下,药名后面查重记了数的除外。


TA的精华主题

TA的得分主题

 楼主| 发表于 2019-7-26 14:19 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 13907933959 于 2019-7-26 14:37 编辑

ming0018 前辈好!

我粗测了一下前辈您的代码,总查找重复药名有295个,查重的结果好像不太准确。


拿“梨”、“梅”两个药材的查重来说,“梨”、查重为20个,结果错误,因只有2个;“梅”、查重为13个,这个结果也错误,因只有2个。

可能是我没讲清楚,导致您误判!“附件”中,一个段落为一个药名,也就是段落查重。


另外、前辈能不能有办法把后面的重药名标红一下,药名后面查重记了数的除外。

TA的精华主题

TA的得分主题

 楼主| 发表于 2019-7-26 14:20 | 显示全部楼层
duquancai 发表于 2019-7-26 11:13
纯文本可以正则处理,如果不是纯文本建议用find

duquancai 前辈好!
是纯word文档,望您赐教!谢谢!

TA的精华主题

TA的得分主题

发表于 2019-7-26 15:09 来自手机 | 显示全部楼层
13907933959 发表于 2019-7-26 14:20
duquancai 前辈好!
是纯word文档,望您赐教!谢谢!

哦,纯文本,那楼上的大神写的完全可以了。我没必要再写。如果不是纯文本,倒是可以写一下代码。

TA的精华主题

TA的得分主题

发表于 2019-7-26 15:42 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
  1. Sub SearchDuplicateStr()
  2.     Dim theStr$, d As Object, i&, j&, theStrTemp$
  3.     Dim reg As Object, theMatches As Object, theMatch As Variant
  4.     '
  5.     Set d = CreateObject("Scripting.Dictionary")
  6.     Set reg = CreateObject("VBScript.RegExp")
  7.     t = timter
  8.    
  9.     With reg
  10.         .Global = True
  11.         .MultiLine = True
  12.         .Pattern = "^[^、]+"
  13.     End With
  14.     With ActiveDocument
  15.         theStr = .Range
  16.         Set theMatches = reg.Execute(theStr)
  17.         For Each theMatch In theMatches
  18.             theStr = theMatch
  19.             d(theStr) = d(theStr) + 1
  20.         Next theMatch
  21.         reg.Global = False
  22.         theStr = .Range
  23.         For i = 0 To d.Count - 1
  24.             j = d.items()(i)
  25.             If j > 1 Then
  26.                 theStrTemp = d.keys()(i)
  27.                 reg.Pattern = "^" & theStrTemp & "、"
  28.                 theStrTemp = theStrTemp & "、(重复" & j & "个)"
  29.                 theStr = reg.Replace(theStr, theStrTemp)
  30.             End If
  31.         Next i
  32.         .Range = theStr
  33.         Dim Par As Paragraph
  34.         For Each Par In .Paragraphs
  35.             theStr = Replace(Par.Range.Text, "、" & Chr(13), "")
  36.             If d(theStr) > 1 Then Par.Range.Font.ColorIndex = wdRed
  37.         Next
  38.     End With
  39.     Set theMatches = Nothing
  40.     Set theMatch = Nothing
  41.     Set d = Nothing
  42.     Debug.Print Timer - t
  43. End Sub
复制代码


我的代码效率太低,但我修改后的结果是和gbgbxgb一样的。
另外,需要标红的话,我修改了一下gbgbxgb的代码,你试一下。

评分

1

查看全部评分

TA的精华主题

TA的得分主题

发表于 2019-7-26 16:12 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
  1. Sub main()
  2.     Dim doc As Document, Rng As Range, d As Object
  3.     Dim arr, i&, tmpstr$
  4.     Set doc = ActiveDocument
  5.     Set Rng = doc.Content
  6.     Set d = CreateObject("scripting.dictionary")
  7.     Application.ScreenUpdating = False
  8.     t = Timer
  9.     arr = Split(Rng.Text, Chr(13))
  10.     tmpstr = Rng.Text
  11.     For i = 0 To UBound(arr)
  12.         If Len(Trim(arr(i))) > 0 Then
  13.             d(arr(i)) = d(arr(i)) + 1
  14.         End If
  15.     Next i
  16.     For i = 0 To UBound(arr)
  17.         If d(arr(i)) > 1 Then
  18.             doc.Range(doc.Paragraphs(i + 1).Range.End - 1, doc.Paragraphs(i + 1).Range.End - 1).Text = "(重复" & d(arr(i)) & "个)"
  19.             d(arr(i)) = -1
  20.         ElseIf d(arr(i)) = -1 Then
  21.             doc.Paragraphs(i + 1).Range.Font.ColorIndex = wdRed
  22.         End If
  23.     Next i
  24.     Application.ScreenUpdating = True
  25.     Debug.Print Timer - t
  26. End Sub
复制代码


这是我根据gbgbxgb的思路又写了一份代码,和gbgbxgb的区别在于,不会改成原文档的格式,缺点就是速度会慢很多。
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-27 20:16 , Processed in 0.047955 second(s), 14 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表