在WORD的插入符号中,有一个普通文本的CJK(CJK Unified Ideographs,C 指中国,J 指日本,K 指朝鲜)统一汉字子集,这是一个字符集合,始于“一”而止于“龥”,Unicode 2.0版中共20902个,通过它,WORD可以判断该字符是否是汉字。该字符也可以从开始菜单/程序/附件/系统工具/字符映射表中获得,当然,后者是WINDODWS的字符基础,决定了前者.
根据WORD查找通配符中[]原则,我们可以将字符集合纳入查找中,勾选通配符,查找项目中输入"[一-龥]",在突出显示所有在该范围内查找到的项目前勾选,点击查找全部,WORD将自动找到所有CJK统一汉字,而不在此序列(集合)中的字符,则不会被查找。
你可以可根据字符集进一步引申,或者任意指定某一升序范围中的字符集。
比如说查找标点符号,我们看一下符号中的广义标点集和CJK统一标点集,分别是"[‐-⁄]","[、-〩]",我们这里只是举例,告诉大家如何查找指定范围内任意单个字符.我们可以试着查找一下"[‐-⁄,、-〩]",当然,一部分中文标点不在此两个集合中,我们可以例举.
理论上说,中文简体字符GB2312的字符集是从CHR(-2050~-20319),即从"啊"开始到"齄"结束,共6763个汉字,但在实际查找中,如果以"[啊-齄]",则部分汉字将不被WORD识别,而如果从"[一-齄]"开始查找,也有部分汉字不被识别,如"齿,龚,龟"等等,换而言之,WORD中的查找汉字字符集,它的依据标准我认为还是以字符映射表为依据的CJK统一汉字字符集(插入/符号同).
OK,请大家一起来补充.
[此贴子已经被作者于2005-7-27 5:45:46编辑过] |