信息时代的编码标准与规范字表
■王晓明
中文信息处理的载体是汉字。为了迎接信息时代的到来,我国于1980年推出了信息交换用汉字编码字符集GB2312-80,与其并行的汉字本体规范有《简化字总表》和《现代汉语通用字表》。至此,汉字规范走向本体与编码的双轨制时代。由于两类规范所承载的功能不同,相互间存在一定程度的差异。
信息技术的迅猛发展,为信息交换构筑了良好的平台,网络技术的发展,使得信息交换日渐便捷与高效,彻底改变了以往的时间、空间概念,信息交换由本土扩展到全球。为了便于国际间的信息交换,国际统一编码字符集提上日程,国际编码标准ISO/IEC10646应运而生,并于1993年正式颁布了第一部分:体系结构与基本多文种平面,即ISO/IEC10646.1-1993,其中包括中日韩表意文字20902个,字量上远远超过了GB2312—80的6763个汉字。为了满足信息处理的需要,国际编码标准ISO/IEC10646一直在不断地将大量汉字纳入其中,促使编码字符集的字量飙升,至今已正式编码的汉字约七万五千个。
既然计算机里已经有了七万多汉字,那么国家语委为什么还要研制《通用规范汉字表》呢?还是那句话:各自承载的功能不同。
首先,国际编码标准ISO/IEC10646中的中日韩表意文字编码字符集囊括了中国(大陆、台湾、香港、澳门)、日本、韩国、朝鲜、新加坡、越南等国家以及美国、日本公司在其信息系统中所使用的表意文字,它的涵盖面几乎是整个汉字文化圈。从以上构成情况不难看出,中日韩表意文字编码字符集是简繁、正异、新旧并存,多语言用字并存的一个杂收字集。
其次,随着编码字量的不断增加,中日韩表意文字编码字符集的性质也由量变发生了质变,由原本简单的信息交换,发展为集交换与储存为一身的字符集。编码字符集的功用在于信息交换与信息呈现,更通俗地说,它的任务只是给世界上通行的汉字一个全世界统一的国际编码。但是,由于编码汉字繁多,字符来源庞杂,同一国家、同一时代的一般用户很难辨析,给大多数普通用户的日常使用带来了沉重的负担,让人无所适从。因此,为了顺应信息时代社会用字的新趋势,为了便于信息的交流与传递,国家语言文字工作委员会及时推出了《通用规范汉字表》。
在信息时代,应理性看待汉字本体规范,它只能承载有限的需求,它与编码规范相互配合,才能构成一个完整的汉字规范体系。发布《通用规范汉字表》目的是引导社会规范用字,方便通用汉字的使用,减轻人们日常用字的负担。所以,《通用规范汉字表》在“通用”与“规范”两个方面下功夫,正是从信息时代全社会的需要出发的。
(作者系高级工程师、国际标准ISO/IEC10646的贡献编辑、国际标准化组织汉字工作组技术编辑)
- 最新内容
- 相关内容
- 网友推荐
- 图文推荐
[高考] 2022 西安电子科技大学《软件工程》大作业答案 (2022-04-25) |
[家长教育] 孩子为什么会和父母感情疏离? (2019-07-14) |
[教师分享] 给远方姐姐的一封信 (2018-11-07) |
[教师分享] 伸缩门 (2018-11-07) |
[教师分享] 回家乡 (2018-11-07) |
[教师分享] 是风味也是人间 (2018-11-07) |
[教师分享] 一句格言的启示 (2018-11-07) |
[教师分享] 无规矩不成方圆 (2018-11-07) |
[教师分享] 第十届全国教育名家论坛有感(二) (2018-11-07) |
[教师分享] 贪玩的小狗 (2018-11-07) |