神奇的中文字符Unicode编码
作者:罗良富http://www.luos.org
中文汉字是像形字,又有数千历史,在我们抄录古籍、整理家谱时,会有很多繁体字、异体字,所有的电脑输入法都是打不出来的。以前常是自己造字或用图片代替,现在可以借助编码来显示了。 为了在一台计算机甚至一个界面上显示多国多民族文字,国际组织制定了可以容纳世界上所有文字和符号的字符编码方案,称为Unicode,用以满足跨语言、跨平台进行文本转换、处理的要求,自从1994年发布,不断进行扩展,目前已经到了Version 10。于是世界上现有的每个文字、符号都有了一个唯一的代码(国际码)。 从源头上说,计算机只认识“1”(电源接通)和“0”(电源断开)两个字,但人们给出二进制编码后,可认识所有的数字。再根据其它十进制、十六进制等的的转换,就可以完成所有的数学表达。而用数字给世界各国的文字和符号编码,让世界上所有的文字、符号都有唯一的一串数字代码,计算机凭借其快速运算功能,就都能一见就认识他们了!这就是Unicode得以实现的基本原理。Unicode编码也叫“万国码”、“万维码”,是真正的“世界语”。 Unicode编码有十制和十六进制,比如云南双柏𥔲嘉镇的“𥔲”这个字,在电脑上是打不出来的。查它的Unicode编码: 十进制码是:152882; 十六进制码是:25532(\u25532)。 于是在网页中,我门既可以表示为:“𥔲”(十进制), 也可以表示为:“𥔲”(十六进制), 注意:后面那个分号“;”是不能少的! 这是不是很神奇呀! 不过,一般地说,IE内核的浏览器对其支持不是很好的。 |