ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 1652|回复: 3

[分享] 判断 txt 文件编码 (ANSI,UTF-16,NO BOM UTF-8, UTF-8)

[复制链接]

TA的精华主题

TA的得分主题

发表于 2022-11-17 19:19 | 显示全部楼层 |阅读模式
本帖最后由 perfect131 于 2022-11-21 13:10 编辑

        TXT文件 标准编码有 ANSI,UTF-16LE,UTF-16BE,NO BOM UTF-8,UTF-8
        vba 代码
  1. ''FilePath 是TXT文件绝对路径,D:\excelhome\1.txt
  2. Function 编码(FilePath As String)
  3.     Dim Data
  4.     With CreateObject("ADODB.Stream")
  5.         .Open
  6.         .Type = 1
  7.         .LoadFromFile FilePath
  8.         Data = .Read
  9.         .Close
  10.     End With
  11.     If IsNull(Data) Then 编码 = "NO BOM UTF-8": Exit Function
  12.     If UBound(Data) < 1 Then 编码 = "NO BOM UTF-8": Exit Function
  13.     If UBound(Data) >= 1 Then
  14.         If UBound(Data) > 1 Then
  15.             If Hex(Data(0)) = "EF" And Hex(Data(1)) = "BB" And Hex(Data(2)) = "BF" Then
  16.                 编码 = "UTF-8": Exit Function
  17.             End If
  18.         End If
  19.         Select Case Hex(Data(0)) & Hex(Data(1))
  20.             Case "FEFF"
  21.                 编码 = "UTF-16 big endian": Exit Function
  22.             Case "FFFE"
  23.                 编码 = "UTF-16 little endian": Exit Function
  24.             Case Else
  25.                 CanBeUTF8 = True
  26.                 For i = 1 To LenB(Data)
  27.                     FirstByte = AscB(MidB(Data, i, 1))
  28.                     If &H0 <= FirstByte And FirstByte <= &H7F Then
  29.                         FollowingBytesCount = 0
  30.                     ElseIf &HC2 <= FirstByte And FirstByte <= &HDF Then
  31.                         FollowingBytesCount = 1
  32.                     ElseIf &HE0 <= FirstByte And FirstByte <= &HEF Then
  33.                         FollowingBytesCount = 2
  34.                     ElseIf &HF0 <= FirstByte And FirstByte <= &HF4 Then
  35.                         FollowingBytesCount = 3
  36.                     Else
  37.                         CanBeUTF8 = False: Exit For
  38.                     End If
  39.                     For j = 1 To FollowingBytesCount
  40.                         i = i + 1
  41.                         If i > LenB(Data) Then
  42.                             CanBeUTF8 = False: Exit For
  43.                         End If
  44.                         FollowingByte = AscB(MidB(Data, i, 1))
  45.                         If (&H80 <= FollowingByte And FollowingByte <= &HBF) = False Then
  46.                             CanBeUTF8 = False: Exit For: i = LenB(Data) + 1
  47.                         End If
  48.                     Next
  49.                 Next
  50.                 编码 = IIf(CanBeUTF8, "NO BOM UTF-8", "ANSI"): Exit Function
  51.             End Select
  52.         End If
  53. End Function
复制代码
实际案例 6楼https://club.excelhome.net/threa ... tml?_dsign=29dceccc






TA的精华主题

TA的得分主题

发表于 2022-11-21 10:29 | 显示全部楼层
感谢分享代码,不过代码有问题,比如这个附件


ansi.zip (195 Bytes, 下载次数: 24)

TA的精华主题

TA的得分主题

发表于 2022-11-21 11:15 来自手机 | 显示全部楼层

TA的精华主题

TA的得分主题

 楼主| 发表于 2022-11-21 11:21 | 显示全部楼层
芐雨 发表于 2022-11-21 10:29
感谢分享代码,不过代码有问题,比如这个附件

原来是 .Read(3)搞的鬼
去掉 (3)即可
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-9-27 20:33 , Processed in 0.036562 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表