ExcelHome技术论坛

 找回密码
 免费注册

QQ登录

只需一步,快速开始

快捷登录

搜索
EH技术汇-专业的职场技能充电站 妙哉!函数段子手趣味讲函数 Excel服务器-会Excel,做管理系统 效率神器,一键搞定繁琐工作
HR薪酬管理数字化实战 Excel 2021函数公式学习大典 Excel数据透视表实战秘技 打造核心竞争力的职场宝典
让更多数据处理,一键完成 数据工作者的案头书 免费直播课集锦 ExcelHome出品 - VBA代码宝免费下载
用ChatGPT与VBA一键搞定Excel WPS表格从入门到精通 Excel VBA经典代码实践指南
查看: 4978|回复: 12

[讨论] Excel部分汉字的 LENB 为1

[复制链接]

TA的精华主题

TA的得分主题

发表于 2021-8-3 20:08 | 显示全部楼层 |阅读模式
本帖最后由 小書生 于 2021-8-3 21:01 编辑

有电脑书上说“凡汉字,都是双字节”,但你是否见过LENB("某汉字")=1的情况呢?打开你的excel输入: "=lenb("㛗")"(网址页面不显示,左边是女子的右边是,女坐 念zuo);

1、这些汉字有读音(网抓,部分没抓出来,见谅)
2、code都是63(但是char(63)=?
3、UNICODE范围为:(①:13312-19893、②:40870-40917、③64048-64109)

4、根据第三条观察,①、②范围内LEFTB为空,但③范围内,却可以得出这个汉字(单元格地址为:E6642:E6703);
5、恕在下技术有限,第三部分范围的汉字,读音一个都没抓到,但的却可以查询到!6、部分汉字比"吖"还小:单元格地址:H6628、H6635-H6640共7个
7、猜测:lenb按照存的区域分类是几个字节,这些都是非常用汉字,很可能是这些字存放的区有关,它强性定义这些区的字,都为1字节;


声明:有部分电脑不显示个别汉字,请忽略!!本帖,转载需经小书生同意!!

欢迎大家补充说明,感谢 丢丢老师 给与帮助,麻辣君老师 给与帮助!







1.jpg
image.png

汉字.rar

431.14 KB, 下载次数: 30

评分

8

查看全部评分

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-8-4 06:40 | 显示全部楼层
[广告] VBA代码宝 - VBA编程加强工具 · VBA代码随查随用  · 内置多项VBA编程加强工具       ★ 免费下载 ★      ★使用手册
本帖最后由 小書生 于 2021-8-4 11:45 编辑

lenb为1,leftb也能够出来
对于中文而言,Unicode 16编码里面已经包含了GB18030里面的所有汉字(27484个字),据不确定消息,目前Unicode标准准备把康熙字典的所有汉字放入到Unicode 32bit编码中。


01.png

评分

2

查看全部评分

TA的精华主题

TA的得分主题

发表于 2021-8-4 08:02 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2021-8-4 08:13 | 显示全部楼层
本帖最后由 jivy1212 于 2021-8-4 08:26 编辑

个人觉得这个属于生僻字,从汉语来讲可能需要深究,但从EXCEL来说,了解下即可。中文是真的难了,很多一直在更新的,EXCEL跟进不了很正常。

TA的精华主题

TA的得分主题

发表于 2021-8-4 09:00 | 显示全部楼层
jivy1212 发表于 2021-8-4 08:13
个人觉得这个属于生僻字,从汉语来讲可能需要深究,但从EXCEL来说,了解下即可。中文是真的难了,很多一直 ...

我问过 我同学的孩子(读中科大计算机系的),他的答复是:
WIN 汉化时,把有些不常用的字给漏了,后来再追加的, 错误地放入日语中区块中(定义为一字节的区块里),这不是 LENB 的问题,是汉化中的问题。因为这些字不常用,没人再去更正前人的过错,我们知道有这码事即可。

LENB 读取字符的字节数,并不是真正统计该字符占用多少字节,而是事先把它定义为1、2字节的库中。在1字节库内的字符,认定为一字节,在2字节库中的字符 认定为二字节。

评分

3

查看全部评分

TA的精华主题

TA的得分主题

发表于 2021-8-4 11:18 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
比吖小的那7个字我电脑显示不出来。

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-8-4 11:28 | 显示全部楼层

Unicode给每个字符提供了一个唯一的数字,不论是什么平台,不论是什么程序,不论是什么语言。基本上,计算机只是处理数字,它们指定一个数字,来储存字母或其他字符。Unicode通常用两个字节表示一个字符,原有的英文编码从单字节变成双字节,只需要把高字节全部填为0就可以。
2005年3月31日推出Unicode 4.1.0;2020年3月10日推出Unicode 13.0.0。标准unicode与GBK等同。后来GB18030开始映射对应;unicode 13.0.0版本为7个扩展区,Unicode计划使用了17个平面,一共有17*65536=1114112个码位(关于unicode统一码介绍,请自行百度);
在非 Unicode 环境下,由于不同国家和地区采用的字符集不一致,很可能出现无法正常显示所有字符的情况。微软公司使用了代码页(Codepage)转换表的技术来过渡性的部分解决这一问题,即通过指定的转换表将非 Unicode 的字符编码转换为同一字符对应的系统内部使用的 Unicode 编码
注:
测试电脑为win10,office365版本(另有说法与版本无关),unicode为13.0.0版本;




010101.jpg

TA的精华主题

TA的得分主题

 楼主| 发表于 2021-8-4 11:29 | 显示全部楼层
[广告] Excel易用宝 - 提升Excel的操作效率 · Excel / WPS表格插件       ★免费下载 ★       ★ 使用帮助
梅州 发表于 2021-8-4 11:18
比吖小的那7个字我电脑显示不出来。

跟unicode版本有关

TA的精华主题

TA的得分主题

发表于 2021-8-4 11:51 | 显示全部楼层

TA的精华主题

TA的得分主题

发表于 2021-8-4 22:20 | 显示全部楼层
拿上小板凳   顶帖支持下
您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

手机版|关于我们|联系我们|ExcelHome

GMT+8, 2024-11-25 15:44 , Processed in 0.038043 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 1999-2023 Wooffice Inc.

沪公网安备 31011702000001号 沪ICP备11019229号-2

本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任!     本站特聘法律顾问:李志群律师

快速回复 返回顶部 返回列表