本帖最后由 anthonii 于 2016-2-22 10:47 编辑
最近在处理数据的时候发现对于char(63)这个非打印字符的处理很有意思,在不同软件不同字体下它的显示是不同的,有时候比空格char(32)要宽,有时候又比它窄,有时候它会被有的软件和char(32)、char(160)相混淆,而在我的电脑环境中,半角问号的十进制ascii编码也是63,如果用excel的code函数来查看char(63)和?的十进制ascii编码会发现它们都是63,但你用char(63)却只能生成这个非打字字符,而且用if函数来判断又会发现这两个字符并不相同,所以我只好把前者称之为char(63)非打印字符,而把后者按其原名称之为半角问号。
有人说,这个非打印字符就是不间断空格,不间断空格就是在word中ctrl+shift+space出来的那个小圆圈,在word中确实和一般空格不一回事,但在我的电脑环境中把不间断空格复制至excel然后用if来判断发现它和半角空格是相同的,而和这里所说的char(63)这个非打印字符是不同的。 对于excel中的处理,用查找空格肯定是找不到它的,用trim也是去不掉的,有人反映用substitute等函数无法去掉,实际上我在我的电脑环境中发现substitute是可以去掉这个字符的,关键在于被替换的一定得是那个非打印字符而不是空格或是问号,而这个非打印字符是用键盘打不出来的,只能是从会处理出错的原字符串中复制。 但在复制的过程中我也发现,部分软件可能是存储所用的字符集不一样的原因,对这个非打印字符的存储方式是不一样的,比如在power query中,我把它从可正常存储它的软件(比如excel,记事本等)中复制至PQ中后是可以被正常替换的,但如果我把它从PQ的查询编辑器中进行一次复制之后,处理就会出错,因为它被自动转化为半角空格char(32)了,这个转化是在把它从编辑器中选中按下ctrl+c的这个时候发生的。
|