ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
楼主: liucqa

[分享] VBA高级教程之基础篇:文本编码和字符串处理(包括指针),ADODB.Stream转换文本编码

  [复制链接]

TA的精华主题

TA的得分主题

发表于 2014-4-25 15:08 | 显示全部楼层
本帖已被收录到知识树中,索引项:文本处理和正则
一口气读完了

TA的精华主题

TA的得分主题

发表于 2014-4-25 20:47 | 显示全部楼层
liucqa 发表于 2013-4-1 01:39
十五、如何识别\u前缀的文本字符
在网页处理过程中,我们经常会遇到以\u开头的文本,这种格式是在每个Unic ...

想必有用,收藏先。谢谢!

TA的精华主题

TA的得分主题

发表于 2014-4-25 20:51 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2014-5-22 11:02 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
感谢楼主好文,昨天花了3个小时,基本弄清了指针的概念。
信息量很大,需要反复看很多遍,收藏了

TA的精华主题

TA的得分主题

发表于 2014-6-20 21:48 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
我都看懂了吗?很精彩,底子太低,对于我来说,如同天书!

TA的精华主题

TA的得分主题

发表于 2014-11-25 10:09 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
好详细,支持楼主

TA的精华主题

TA的得分主题

发表于 2015-1-20 22:37 | 显示全部楼层
字符串快速转换为UTF-8码的自定义函数(单一功能)。

这个是正常字符转为UTF码的自定义函数:
  1. Function GetUTF$(txt$)
  2.     For i = 1 To Len(txt)
  3.         t = AscW(Mid(txt, i, 1)): If t < 0 Then t = 65536 + t
  4.         If t < 128 Then GetUTF = GetUTF & Hex(t) Else GetUTF = GetUTF & "e" & Hex(t \ 4096) & Hex((t \ 64) Mod 64 + 128) & Hex(t Mod 64 + 128)
  5.     Next
  6. End Function
复制代码
代码加码计算原理:
<128的直接用2位16进制数表示,
其它字符的AscW码值,按照64进制转换为3组10进制数,
然后,第1组转16进制并添加前导"e" (相当于10进制数+224或16进制"E0")
而第2和第3组的10进制数还要加上128(保证和<128的字符区分开来),然后再转为2位的16进制字符。
转换后的3组拼接字符即是UTF-8码。

原问题帖:
http://club.excelhome.net/forum. ... 108&pid=8055686

TA的精华主题

TA的得分主题

发表于 2015-1-20 22:41 | 显示全部楼层
本帖最后由 香川群子 于 2015-1-20 23:37 编辑

以及UTF-8码快速转换为字符串的自定义函数(单一功能)。

再次研究了一下UTF码转换规律,发现更简单的算法:

  1. Function ChrU$(txt$) 'Change UTF To Char
  2.     For i = 1 To Len(txt)
  3.         t = Val("&H" & Mid(txt, i, 2))
  4.         If t < 128 Then ChrU = ChrU & Chr(t): i = i + 1 Else ChrU = ChrU & ChrW(Val("&H" & Mid(txt, i + 1, 1)) * 4096 + (Val("&H" & Mid(txt, i + 2, 2)) - 128) * 64 + Val("&H" & Mid(txt, i + 4, 2)) - 128): i = i + 5
  5.     Next
  6. End Function
复制代码
复制代码6位16进制转ChrW字符的具体计算过程如下:

     t1 = Val("&H" & Mid(txt, i + 1, 1))          '取第1组的第2个16进字符转为10进制数 (第1个设别字符e无需使用)
    t2 = Val("&H" & Mid(txt, i + 2, 2)) - 128  '取第2组的2个16进制字符转10进制数并减去128
    t3 = Val("&H" & Mid(txt, i + 4, 2)) - 128  '取第3组的2个16进制字符转10进制数并减去128
    t4 = t1 * 4096 +  t2 * 64 + t3               't1乘以4096+t2乘以64+t3得到该UTF-8码的AscW码值。

    t5 = ChrW(t4) 这样就可以用ChrW函数转换为有效字符了。


原问题帖:
http://club.excelhome.net/forum. ... 1181108&pid=8055605

TA的精华主题

TA的得分主题

 楼主| 发表于 2015-1-21 18:30 | 显示全部楼层
香川群子 发表于 2015-1-20 22:37
字符串快速转换为UTF-8码的自定义函数(单一功能)。

这个是正常字符转为UTF码的自定义函数:代码加码计 ...

http://www.cnblogs.com/chenwenbi ... /08/11/2134503.html

UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。

UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0;如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。UTF-8最多可用到6个字节。
如表:
1字节 0xxxxxxx
2字节 110xxxxx 10xxxxxx
3字节 1110xxxx 10xxxxxx 10xxxxxx
4字节 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
5字节 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
6字节 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

TA的精华主题

TA的得分主题

发表于 2015-4-28 09:00 | 显示全部楼层
阅。谢。写得不错。

似乎,没有不同编码间的直接转换代码。这个需求或不多。但有,就更完美。

点评

大部分转换都可以用14楼的BytesToBstr函数处理。  发表于 2015-4-28 09:18
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-12-25 22:11 , Processed in 0.036652 second(s), 6 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表