ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 Excel Home精品图文教程库
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
300集Office 2010微视频教程 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 329|回复: 4

[求助] 如何用VBA先把Word文档中的所有汉字转成Unicode代码,再还原成汉字?

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-4-17 17:29 | 显示全部楼层 |阅读模式
我用GrindEQ将一*.tex格式的文件转成DOCX文档时,西文字符甚至数学公式都能正确转换过来,但发现对汉字和全角字符支持有问题,转成的DOCX文档中原来很多汉字变成了其他汉字(有的还是繁体字、日文汉字或偏旁部首),为此,我想先将原*.tex文件读入Word,运行VBA后,将所有汉字转成加半角{}的标记符的Unicode代码,如:

中→{4E2D}
国→{56FD}
℃→{2103}
仅针对汉字和全角字符,半角字符一律不转。


这样处理后,因为汉字和全角字符已变成半角字符,肯定就不会有问题了,再用VBA将所得的DOCX文档中此类字符串逆转成汉字和全角字符,如:

{4E2D}→
{56FD}→国
{2103}→℃



怎样用2段VBA代码实现?

TA的精华主题

TA的得分主题

发表于 2023-4-18 11:50 | 显示全部楼层
本帖最后由 batmanbbs 于 2023-4-18 12:14 编辑


忘考虑负值了,修正一下
image.png

TA的精华主题

TA的得分主题

发表于 2023-4-18 14:27 | 显示全部楼层
本帖最后由 wdpfox 于 2023-4-19 17:17 编辑

不明觉厉           

TA的精华主题

TA的得分主题

发表于 2023-4-18 14:39 | 显示全部楼层
  1. Sub 测试()

  2.     'Call 转换编码(True) ' True:汉字转Unicode;False:Unicode转汉字
  3.     Call 转换编码(False) ' True:汉字转Unicode;False:Unicode转汉字

  4. End Sub

  5. Private Sub 转换编码(ChangeType As Boolean)

  6.     Selection.HomeKey unit:=wdStory

  7.     With Selection.Find
  8.         .ClearFormatting
  9.         .Replacement.ClearFormatting

  10.         .Text = IIf(ChangeType, "[!^1-^127]", "\{[\+\-][0-9]{4,5}\}")
  11.         .Forward = True
  12.         .Wrap = wdFindContinue
  13.         .MatchWildcards = True
  14.         .Format = False
  15.         
  16.         Do While .Execute
  17.             With Selection.Range
  18.                 If ChangeType Then
  19.                     .Text = "{" & IIf(AscW(.Text) > 0, "+", "") & AscW(.Text) & "}"
  20.                 Else
  21.                     .Text = ChrW(Val(Mid(.Text, 2, Len(.Text) - 2)))
  22.                 End If
  23.             End With
  24.         Loop

  25.         .ClearFormatting
  26.         .Replacement.ClearFormatting
  27.     End With

  28. End Sub
复制代码

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-4-18 17:01 | 显示全部楼层
本帖最后由 ssq1109 于 2023-4-18 17:42 编辑

谢谢batmanbbs!上面的代码是部分可达目的,但遇到全角标点会出错。
不过将.Text = IIf(ChangeType, "[!^1-^127]", "\{[\+\-][0-9]{4,5}\}")修改一下字符数范围即可,即为:
.Text = IIf(ChangeType, "[!^1-^127]", "\{[\+\-][0-9]{3,5}\}")
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-5-17 17:11 , Processed in 0.039140 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表