最新汉字编码课件.ppt

最新汉字编码课件.ppt

ID:57201770

大小:231.00 KB

页数:36页

时间:2020-08-03

最新汉字编码课件.ppt_第1页
最新汉字编码课件.ppt_第2页
最新汉字编码课件.ppt_第3页
最新汉字编码课件.ppt_第4页
最新汉字编码课件.ppt_第5页
资源描述:

《最新汉字编码课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、汉字编码bjhk1汉字编码现状及其根源多种编码方案共存,不利于交流和共享新旧标准同台使用,需相互转换统一标准正在形成中、日、韩、新等多国同时使用汉字简繁体汉字并存地区、国家间的文化、政治差异增加了汉字统一编码的难度bjhk2主要汉字(文字)编码标准与规范ASCII(英文)GB2312GBKGB13000GB18030BIG5Shift_JISISO/IEC10646Unicodebjhk3汉字的几种通行名称Hanzi,Hantsu,汉字Ideographiccharacter,表意字符,中文字符Kanji-日文中的叫法Hanja

2、-朝鲜文中的叫法CJK-中日韩通用字符集Unihanbjhk4ASCII码美国信息交换标准编码(“美标”)用从0到127的128个数字来代表信息的规范编码包括33个控制码,一个空格码,和94个形象码形象码中包括了英文大小写字母,阿拉伯数字,标点符号等国际上大部分电脑的通用编码bjhk5文本文件与二进制文件字符大都是用一个八位二进制数字表示,美标只规定了128个编码,剩下的另外128个数码没有规范,美标中的33个控制码,各厂家用法也不尽一致文本文件(ASCIITextFiles):美标形象码或空格码组成,通常可在不同电脑系统间直接

3、交换二进制文件(BinaryFiles):含有控制码或非美标码的文件,通常不能在不同电脑系统间直接交换bjhk6国标、区位、“准国标”、机内码国标:中华人民共和国国家标准信息交换用汉字编码国标(GB2312-80)表(基本表)把七千余汉字、以及标点符号、外文字母等,排成一个94行、94列的方阵每一横行叫一个“区”,每个区有九十四个“位”一个汉字在方阵中的坐标,称为该字的“区位码”例如“中”字在方阵中处于第54区第48位,它的区位码就是5448bjhk7区位码表区位码来源于信息交换用汉字编码字符集(基本集)国家标准(GB2312-

4、80),该标准收汉字6763个,第一级3755个,位于16至55区,55区的最后5个字符没有定义;第二级3008个,位于56至87区第一级汉字按照汉语拼音字母顺序排列,同音字以笔形顺序横(一)、直(丨)、撇(丿)、点(丶)、折(乙)为序。起笔相同按第二笔,依次类推。第二级汉字按部首排序,本标准采用的部首与一般字典用的部首基本相同,略有改变。部首次序及同部首字按笔划数排列,同笔划数的字以笔形顺序横(一)、直(丨)、撇(丿)、点(丶)、折(乙)为序。起笔相同按第二笔,依次类推。查表时先查区号,再查行、列,例如:“、”是0102,“蔼

5、”是1610。bjhk8例bjhk9例bjhk10例bjhk11例bjhk12例bjhk13例bjhk14国标、区位、“准国标”、机内码94:美标中形象码的总数,33--126汉字区、位码各加上32,就会与美标形象码的范围重合,称为该字的“国标码”,与其相对应的两个美标符号,为该字的“国标符”如何区分国标符与美标符:国标码的两个数字各加上128,称“准国标”或“机内码”机内码=(区位码)H+8080H+2020Hbjhk15BIG5码针对繁体汉字的编码,在台湾、香港的电脑系统中得到普遍应用bjhk16ISO/IEC10646一个

6、国际标准编号,国际标准化组织(ISO)1993年正式颁布英文全称:Informationtechnology-UniversalMultiple-OctetCodedCharacterSet,简称UCS中文全称:信息技术--通用多八位编码字符集,亦称大字符集宗旨:全球所有文种统一编码bjhk17Unicode英文UniversalCode的缩略语统一编码是对国际标准ISO/IEC10646编码的一种称谓是一个企业联盟集团的名称,由美国的HP、Microsoft、IBM、Apple等几家知名的大型计算机企业所组成,成立该集团的宗旨

7、就是要推进多文种的统一编码就内容而言,Unicode和ISO/IEC10646是一致的,并行的bjhk18CJK-中日韩统一汉字把中国、日本与韩国的英文称谓的首字母用于ISO/IEC10646中的中、日、韩统一编码汉字的简称UnihanCJKV或许更准确,V代表越南bjhk19ISO/IEC10646的体系结构四维的编码空间总体上分为128个三维组(group),group的值范围是从00到7F每一组包含256个平面(plane),每一个平面包含256行(row),每一行包含256个字位(cell),又称为“列”,plane、r

8、ow、cell的值范围都是从00到FF全编码整个编码字符集的每个字符都是由4个八位序列表示,(按照组八位、面八位、行八位、列八位的顺序)可编码空间为:128X256X256X256=32KX64Kbjhk20ISO/IEC10646体系结构图bjhk21基本多文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。