汉字‘身份证’杂谈、趣谈-‘语委身份证’及‘标准身份证’

汉字‘身份证’杂谈、趣谈-‘语委身份证’及‘标准身份证’

ID:9047056

大小:44.00 KB

页数:3页

时间:2018-04-15

汉字‘身份证’杂谈、趣谈-‘语委身份证’及‘标准身份证’_第1页
汉字‘身份证’杂谈、趣谈-‘语委身份证’及‘标准身份证’_第2页
汉字‘身份证’杂谈、趣谈-‘语委身份证’及‘标准身份证’_第3页
资源描述:

《汉字‘身份证’杂谈、趣谈-‘语委身份证’及‘标准身份证’》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、汉字‘身份证’杂谈、趣谈(二)----‘语委身份证’及‘标准身份证’两种‘身份证’的比较(即《字表》与《编码标准》的比较)乙:那么,汉字身份证问题,应该如何理解,如何处理?新时期汉字的‘身份证’到底什么意思呀?甲:现在如果从实际出发,应该承认有两种‘身份证’:一种是‘语委身份证’;另一种是‘标准身份证’。两种身份证有严重打架现象。语委身份证,是以国家语委的法规为依据判定。那些异体字直到2003年《字表》发布才获得语委身份证。而按汉字编码技术标准看,1993年就获得了标准身份证。对于繁体字,1993年也获得了‘标准身份证’,而国家语委至今还是扣发着繁体字的‘语委身份证’

2、,王组长更是明确地把繁体字称为“不规范字”;这就像是给繁体字脖子上挂上一块‘走资派’的牌子一样。这是同一个国家、两个部门在打架。乙:看来,收进《字表》,就算有了‘语委身份证’了。那‘标准身份证’的判据是什么?甲:电脑时代,有‘标准身份证’应该是指‘能够在网络上为广大海内外汉字用户使用’,显然地,这个‘使用’是通过‘电脑’及/或‘网络’的‘使用’。一个汉字能够做到这一点,仅仅要求它是汉字编码标准字符集里的成员。具体些说:它具备如下5条:①被收入标准化的编码字符集。②在汉字编码表里获得一个位置,或得到一个属于它的二进制代码。这种编码字符集结构越来越复杂。③给出它的字形信息

3、,包括一般至少四种字体(宋、仿、隶、楷),每一种字体的数十种字号(如初号、一号、......五号、小五号、六号、...)的不同点阵精度的(15*16、24*24、...128*128、...256*256...)点阵字形信息。④有多种汉字输入法给出了每个汉字的输入代码,及大量涉及该字的词汇、短语的输入代码。⑤有相应的操作系统及文字处理软件。特别是前四款,必须对每一个汉字单独给出。从这五个条件看:1993年,这些异体字仅仅解决了①、②、③;到1995年五条都具备。而国家语委给予的仅仅是①。以上五款中的每一项(也可以不妨除去①)都包含着大量、繁杂的技术工作。就说第②款吧。

4、对于最早、最简单的汉字基本集来说,它收汉字6763个。其中每个用两个字节(两个8位二进制数码)表达。整个基本集用一张94*94的表格表示。对于GBK1和GBK2来说,即使用双字节编码,也使用四字节编码。其编码表结构复杂得多。下面图表是解说编码结构时通常需要引用的。对于理工科大学生,讲解这个结构图表也需化不少时间那。GB18030-2000码位总体结构图GB18030-2000汉字  如下表所示,GB18030-2000收录了27533个汉字:  类别码位范围码位数字符数字符类型双字节部分第一字节0xB0-0xF7第二字节0xA1-0xFE67686763汉字第一字节0

5、x81-0xA0第二字节0x40-0xFE60806080汉字第一字节0xAA-0xFE第二字节0x40-0xA081608160汉字四字节部分第一字节0x81-0x82第二字节0x30-0x39第三字节0x81-0xFE第四字节0x30-0x3965306530CJK统一汉字扩充A  (注:此处CJK表示中日韩)乙:看来,编码字符集结构是越来越复杂了。甲:是的。再说③,汉字的字形信息。它至少包括四种字体(宋、仿、隶、楷)、数十种字号的点阵字形信息,还包括不同精度(如:16*16,24*24,48*48,....,256*256等等)。这里,还有许多技术问题,如字形的

6、曲线轮廓表达。对一种字体,只需要一个中低规模储存量的曲线表达,就能够自动、快速生成各种精度的点阵字形信息。乙:我知道,汉字字库工作量极大,新技术也多。已经是一项产业了。甲:最后说④,多种汉字输入法。每个都要给出每个汉字的输入代码,以及相关词语的智能化输入设计。以上的②、③、④、⑤,是国家语委的《字表》里都没有的。就27484个汉字而言,其五款(①—⑤),和简单的8105个字的《字表》的仅仅①的工作量比较,大上几百倍几千倍恐怕都不只。由于有①—⑤款,编码字符集里的字,才能够使我们与五湖四海的人网络沟通。如果没有《标准身份证》,而只有《语委身份证》(只有①),那我们都得退

7、回到铅字时代,退回到四码电报时代。《语委身份证》仅仅相当于《标准身份证》里的①款。乙:能否再简要些总结一下《字表》与《编码标准》的基本差异?甲:《字表》是机械化时代,铅字时代汉字规范的主要方式,也几乎是唯一方式。它主要是针对人,针对使用汉字的人。通过对汉字使用者的教育、管理,实现对汉字的规范;它并不能直接控制、指挥最终的汉字设备。而《编码标准》则是电脑时代的产物。它是新时代汉字规范的最重要、最有效、最强大的手段。它即针对‘人’(汉字使用者),也针对、或者更针对‘设备及系统’。它能够直接地管理、控制最终的汉字设备,如打字机、打印机、复印机、....。它

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。