ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1978|回复: 10

[求助] 文本ANSI、UTF-8、GBK不同编码间转换的疑问

[复制链接]

TA的精华主题

TA的得分主题

发表于 2023-2-14 14:37 | 显示全部楼层 |阅读模式
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助

一段文字,在记事本中用指定ANSI格式保存(另存为)
微信截图_20230214141535.png


然后用Notepad++打开文档,显示正常:
微信截图_20230214141935.png
但当我选择编码为ANSI,却显示乱码:
微信截图_20230214142046.png
微信截图_20230214142115.png
当再用UTF-8编码时,反而是正常的:
微信截图_20230214142157.png

问题一,为什么同为ANSI编码,一个正确,一个乱码,ANSI与UTF-8GI 不同应用会自动转换?

问题二,UTF-8如何转为GBK编码?一定要用 GBK汉字字符集 逐个翻译吗


TA的精华主题

TA的得分主题

发表于 2023-2-14 18:55 | 显示全部楼层
问题一,正常情况下会自动转换的

TA的精华主题

TA的得分主题

发表于 2023-2-14 19:24 来自手机 | 显示全部楼层
本帖最后由 wanghan519 于 2023-2-14 19:34 编辑

notepad++前两天刚爆出来,不反桦就改你代码的问题,作者说是开个玩笑,最好别讨论这个。

另外,常见的转码工具是iconv,或者vim真的很好用,set fileencoding=cp936就可以转码,也可以批量处理

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-14 20:04 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
高个子 发表于 2023-2-14 18:55
问题一,正常情况下会自动转换的

怎样用NASI仍显示正常,不是以文本原格式为准,其他格式"兼容"也能显示吗,反倒是原格式不能正常显示了
。。。。。。
测试了一下,发现与 Notepad++ 打开似乎默认用UTF-8编码格式显示(反正不是NASI),与原格式无关,
但当你设置好当前页面编码格式,以粘贴方式贴入数据时,设置什么就是什么,都能显示,与原格式无关,
但粘贴后,再转换选择不同编码时,同样不能正常显示

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-14 20:06 | 显示全部楼层
文本文档,可用下面函数作个判断:
  1. Function GetFileCode(ByVal strFilePath As String)
  2.     Dim intFile As Integer
  3.     Dim arrTmp(2) As Byte
  4.     Dim i As Long
  5.     intFile = FreeFile
  6.     Open strFilePath For Binary Access Read As #intFile
  7.     Get #intFile, 1, arrTmp
  8.     Close #intFile
  9.     Select Case arrTmp(0) & arrTmp(1)
  10.         Case "255254"
  11.             GetEncode = "Unicode"
  12.         Case "254255"
  13.             GetEncode = "Unicode Big Endian"
  14.         Case "239187"
  15.             GetEncode = "UTF-8"
  16.         Case Else
  17.             GetEncode = "ANSI or Other"
  18.     End Select
  19.     GetFileCode = GetEncode
  20. End Function
复制代码

TA的精华主题

TA的得分主题

发表于 2023-2-15 12:37 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-15 18:36 | 显示全部楼层
perfect131 发表于 2023-2-15 12:37
NO BOM UTF-8判断
https://club.excelhome.net/thread-1646478-1-1.html

谢谢分享,学习了,
问题二,UTF-8如何转为GBK编码?
请教下如何实现

TA的精华主题

TA的得分主题

发表于 2023-2-16 19:12 | 显示全部楼层
aman1516 发表于 2023-2-15 18:36
谢谢分享,学习了,
问题二,UTF-8如何转为GBK编码?
请教下如何实现
  1. #If Win64 Then
  2.     Public Declare PtrSafe Function WideCharToMultiByte Lib "kernel32" (ByVal CodePage As Long, _
  3.         ByVal dwFlags As Long, ByVal lpWideCharStr As Long, ByVal cchWideChar As Long, _
  4.         ByVal lpMultiByteStr As Long, ByVal cchMultiByte As Long, ByVal lpDefaultChar As Long, _
  5.         ByVal lpUsedDefaultChar As Long) As Long
  6.     Public Declare PtrSafe Function MultiByteToWideChar Lib "kernel32.dll" (ByVal CodePage As Long, _
  7.         ByVal dwFlags As Long, ByVal lpMultiByteStr As Long, ByVal cchMultiByte As Long, _
  8.         ByVal lpWideCharStr As Long, ByVal cchWideChar As Long) As Long
  9. #Else
  10.     Public Declare Function WideCharToMultiByte Lib "kernel32" (ByVal CodePage As Long, _
  11.         ByVal dwFlags As Long, ByVal lpWideCharStr As Long, ByVal cchWideChar As Long, _
  12.         ByVal lpMultiByteStr As Long, ByVal cchMultiByte As Long, ByVal lpDefaultChar As Long, _
  13.         ByVal lpUsedDefaultChar As Long) As Long
  14.     Public Declare Function MultiByteToWideChar Lib "kernel32.dll" (ByVal CodePage As Long, _
  15.         ByVal dwFlags As Long, ByVal lpMultiByteStr As Long, ByVal cchMultiByte As Long, _
  16.         ByVal lpWideCharStr As Long, ByVal cchWideChar As Long) As Long
  17. #End If

  18. 'GB2312 转换成UTF-8
  19. Public Function GB2312toUTF8(ByVal str As String) As String
  20.     Dim b() As Byte, i As Long, j As Long, k As Long
  21.     b = StrConv(str, vbFromUnicode)
  22.     ReDim c(UBound(b) * 3) As Byte
  23.     For i = 0 To UBound(b)
  24.         If b(i) < 128 Then
  25.             c(j) = b(i)
  26.             j = j + 1
  27.         Else
  28.             k = WideCharToMultiByte(CP_UTF8, 0, StrConv(ChrW$(b(i)), vbUnicode), -1, ByVal 0&, 0, ByVal 0&, ByVal 0&)
  29.             If k > 2 Then
  30.                 WideCharToMultiByte CP_UTF8, 0, StrConv(ChrW$(b(i)), vbUnicode), -1, c(j), k + 1, ByVal 0&, ByVal 0&
  31.                 j = j + k - 1
  32.             End If
  33.         End If
  34.     Next i
  35.     GB2312toUTF8 = StrConv(c(), vbUnicode)
  36. End Function

  37. 'UTF-8 转换成GB2312
  38. Public Function UTF8toGB2312(ByVal str As String) As String
  39.     Dim b() As Byte, i As Long, j As Long
  40.     b = StrConv(str & ChrW$(&HFEFF), vbFromUnicode)
  41.     For i = LBound(b) To UBound(b)
  42.         If (b(i) And &H80&) <> &H80& Then
  43.             j = MultiByteToWideChar(CP_UTF8, MB_PRECOMPOSED Or MB_ERR_INVALID_CHARS, b(i), -1, ByVal lpBuffer&, LenB(lpBuffer))
  44.         ElseIf (b(i) And &HE0&) <> &HE0& Then
  45.             j = MultiByteToWideChar(CP_UTF8, MB_PRECOMPOSED Or MB_ERR_INVALID_CHARS, CLng((b(i) And &H1F&) * &H10000 Or (b(i + 1) And &H3F&) * &H100& Or (b(i + 2) And &H3F&)), -1, ByVal lpBuffer&, LenB(lpBuffer))
  46.             i = i + 2
  47.         ElseIf (b(i) And &HF0&) <> &HF0& Then
  48.             j = MultiByteToWideChar(CP_UTF8, MB_PRECOMPOSED Or MB_ERR_INVALID_CHARS, CLng((b(i) And &HF&) * &H40000000 Or (b(i + 1) And &H3F&) * &H10000 Or (b(i + 2) And &H3F&) * &H100& Or (b(i + 3) And &H3F&)), -1, ByVal lpBuffer&, LenB(lpBuffer))
  49.             i = i + 3
  50.         End If
  51.     Next i
  52.     UTF8toGB2312 = StrConv(lpBuffer, j, vbFromUnicode)
  53. End Function

复制代码
参考 http://www.exceloffice.net/archives/999

评分

1

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-16 23:04 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
smsn 发表于 2023-2-16 19:12
参考 http://www.exceloffice.net/archives/999

在学习摸索中前行.......

TA的精华主题

TA的得分主题

 楼主| 发表于 2023-2-18 10:43 | 显示全部楼层
VBA高级教程之基础篇:文本编码和字符串处理(包括指针),ADODB.Stream转换文本编码
https://club.excelhome.net/thread-998747-1-1.html

正如老师所说,文本编码是一个深奥的课题,本文不过是介绍了冰山一角而已
看完终于摸了一下皮毛......

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-19 04:35 , Processed in 0.048453 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表