抓住机遇 构筑稳健的中文Linux系统( 三 )


ISO 10646 信息技术通用多八位编码字符集(Information technology-Universal Multiple-
octet Coded Character Set,缩写为UCS)是国际标准化组织对全世界各国地区使用的书面语言文字及符号进行统一编码的编码字符集的国际标准 。已于1993年5月正式审定公布了ISO 10646.1 。我国根据等同采用国际标准的原则,也于1993年12月宣布为国家标准GB13000.1 。
目前,该标准已收入了各国现行标准的文字符号近六万个,可用于世界上多种语言的书面形式及附加符号的表示、输入、显示、存储、处理、交换和传输 。其中中文简繁体汉字、日文用汉字、朝鲜文用汉字(简称CJK汉字)共20902个 。
ISO 10646标准颁布后,又经历了一系列的修改与扩充 。经过中、日、韩等国的不懈努力,目前CJK汉字扩充集的6582个汉字、彝文和汉字结构符、汉字部首与构件编码已纳入BMP,蒙文和藏文编码也取得重要进展 。目前正在制定辅助平面(可收入汉字的标准,辅助平面2将纳入CJK汉字扩充集Extension B的四万多汉字及Super CJK的六万多汉字 。
其实,使用ISO 10646,中国是最大的受益国 。但奇怪的是国外的公司为了软件的国际化对ISO 10646十分积极,而我国的部分企业却不重视 。
但是国际化标准的制定进展太慢,可能是对“地方”的积极性没有发挥或发挥不够 。特别是UCS中最大量、最困难的工作是汉字部分 。在制定UCS标准时应充分重视中国的意见,并充分发挥中国的积极性 。
在处理汉字字符集方面,考虑语言中的内在关系,哪些字是常用、次常用,如何排序(按汉语拼音、笔划、部首),如何寻求最佳方案等,最有研究、最有发言权的自然是中国人 。当然,海外华人和日本、朝鲜、韩国也都使用汉字,他们对汉字字符也很有研究,也要充分考虑他们的意见,但最大的用户和市场是在中国 。
国际化标准组织在汉字字符集中应以中国的意见为重,另外如IBM、SUN等大公司对汉字本地化也有很多研究,对国际化做出很大贡献,也应多和他们协商 。
每个国家执行的是本国的国家标准,国际标准只有变为国家标准时才能被该国执行 。国际标准是通过多国的国家标准来实现的 。
国际化与本地化是一个辨证的关系 。国际化是为了解决软件能在各个使用不同语言、不同风俗的国家和地区的编码字符集都能使用的问题,而对计算机程序作出的某些规定 。简言之,国际化正是为了解决本地化 。另一方面,本地化是国际化向特定本地语言环境的转换,本地化要适应国际化的规定 。
国际化标准组织要充分尊重各国标准化组织的意见 。汉字共有七八万个,从码位的占有率来看是绝大多数,而且汉字又有简体、繁体、日文用汉字、朝鲜文用汉字、韩国用汉字,可谓是最复杂的 。国际化工作中最大量、最复杂的工作就是解决汉字本地化的问题,如果汉字本地化解决好了,国际化的工作就完成了一大半 。汉字本地化解决得好坏是衡量国际化工作好坏的试金石 。全世界使用汉字的人最多,汉字又是联合国使用的文字,解决好汉字本地化意义十分重大 。国际化标准组织应该格外重视中国标准化组织的意见,而不只是听取各中文Linux厂商的意见 。现在国际化组织的成果虽然已上网,但与中国标准化组织机构并未建立直接、畅通,有效的联系渠道 。
而且对中文(汉字)最了解的还是中国人自己 。中文本地化离开中国人是搞不好的,国际化离开中国人也是搞不好的 。
另一方面,中国的标准化组织也应主动和Linux国际化组织取得联系,反映自己的意见,有问题和Linux国际化组织协商解决 。

推荐阅读