ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 319|回复: 1

AI讲解字典分离中英文

[复制链接]

TA的精华主题

TA的得分主题

发表于 2024-9-11 10:49 | 显示全部楼层 |阅读模式
本帖最后由 ning84 于 2024-9-11 10:59 编辑

image.png



照猫画虎,结果不对,没有空格和数字

TherearecurrentlyeightparishesinMacau
澳门现有个堂区


代码如下
  1. Sub llll()
  2.    Dim ii, oChar, English, Chinese
  3.    Dim Str
  4.       Str = "澳门现有8个堂区There are currently eight parishes in Macau."
  5.    Dim EngDict As Scripting.Dictionary, ChiDict As Scripting.Dictionary
  6.    Dim Dict As Scripting.Dictionary
  7.        Set Dict = New Scripting.Dictionary
  8.       For ii = 1 To Len(Str)
  9.           oChar = Mid(Str, ii, 1)
  10.           Debug.Print oChar
  11.        If Asc(oChar) >= 65 And Asc(oChar) <= 122 Then
  12.             English = English & oChar
  13.         ElseIf Asc(oChar) >= -20319 And Asc(oChar) <= -3652 Then
  14.             Chinese = Chinese & oChar
  15.         End If
  16.       Next ii
  17.       Dict.Add "English", English
  18.       Dict.Add "Chinese", Chinese
  19. Stop
  20.       Debug.Print Dict("English") & vbCr; Dict("Chinese")
  21. End Sub
复制代码


遇到这种字符如何中文分离  Sé,St.等等。


"大堂区 Parish of Sé"
"望德堂区 Parish of St. Lazarus"
"风顺堂区 Parish of St. Lawrence"
"嘉模堂区 Parish of Our Lady of Carmel"
"圣方济各堂区 Parish of St. Francis Xavier"
"路氹填海区 Cotai Reclamation Area"

TA的精华主题

TA的得分主题

 楼主| 发表于 2024-9-11 19:31 | 显示全部楼层
正则方法


image.png


  1. Function SeparateChineseAndEnglish(text As String) As String
  2.     Dim regEx As VBScript_RegExp_55.RegExp
  3.     Set regEx = New VBScript_RegExp_55.RegExp
  4.     regEx.Pattern = "[\u4e00-\u9fa5]+"
  5.     Dim chineseMatches As VBScript_RegExp_55.MatchCollection
  6.     Set chineseMatches = regEx.Execute(text)
  7.     Dim chineseText As String
  8.     For Each Match In chineseMatches
  9.         chineseText = chineseText & Match.Value
  10.     Next
  11.     regEx.Pattern = "\b[\w\s\d]+\b [a-zA-Z]+"
  12.     Dim englishMatches As VBScript_RegExp_55.MatchCollection
  13.     Set englishMatches = regEx.Execute(text)
  14.     Dim englishText As String
  15.     For Each Match In englishMatches
  16.         englishText = englishText & Match.Value
  17.     Next
  18.     Debug.Print englishText
  19.     SeparateChineseAndEnglish = chineseText & " " & englishText
  20.     Stop
  21. End Function
  22. Sub TestSeparation()
  23.     Dim inputText As String
  24.     inputText = "Hello 你好 World!世界"
  25.     inputText = "澳门现有8个堂区There are currently eight parishes in Macau."
  26.     Debug.Print (SeparateChineseAndEnglish(inputText))
  27.     Stop
  28. End Sub
复制代码


学习regEx.Pattern = "[\u4e00-\u9fa5]+"  和 "\b[\w\s\d]+\b [a-zA-Z]+"
学习
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-10-23 18:34 , Processed in 0.037194 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表