编码史记_

编码史记_

ID:63499619

大小:14.87 KB

页数:6页

时间:2021-08-25

编码史记__第1页
编码史记__第2页
编码史记__第3页
编码史记__第4页
编码史记__第5页
编码史记__第6页
资源描述:

《编码史记_》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、编码史记_字符编码的故事字符是什么字符是什么?就是有意义的图形,比如a,中等。在不同的国家代表不同的意思。但是在计算机世界中只有0和1,好了,如何用0和1将这些字符表示出来呢?这就是编码存在的意义。编码一点也不高深,就是一个计算机的01和字符ab的简洁映射。于是故事开头了...很久很久以前,计算机世界只有美国人。美国人的文字造诣很低的,他们的全部文字就只有24个字母,甚至加上大写和小写,阿拉伯数字,计算机中的掌握符(回车啥的)都不超过256个(只有127个)。于是,对于他们来说,很自然,那么计算机中用8位就可以表示他们的全部

2、字符了吧。于是他们将8位称作一个字节,计算机的8位表示的每个数字对应了一个英文字符,画了一张表(ASCII码表)。最早的编码AscII码消失了。欧洲人出场了。欧洲是有好多个国家的,他们的每个国家也都有自己的文字,比如拉丁文,希腊文等。怎么办呢?于是想到,你美国人指定的ASCII码表里面不是只有127个字符吗,后面128-255的字符不是说待定吗,好吧,我们就不客气了。于是欧洲人就将各种惊奇的语言塞入127后面的字符中,形成了一系列的ISO8859字符集。比如希腊文塞入ASCII,就形成了ISO/IEC8859-7,西欧语种塞

3、入ASCII就形成了ISO/IEC8859-1,ISO/IEC8859-1也叫做latin-1。(对,就是mysql里面常常见到的编码)下面是ISO8859现有的15个字符集ISO/IEC8859-1(Latin-1)-西欧语言ISO/IEC8859-2(Latin-2)-中欧语言ISO/IEC8859-3(Latin-3)-南欧语言。世界语也可用此字符集显示。ISO/IEC8859-4(Latin-4)-北欧语言ISO/IEC8859-5(Cyrillic)-斯拉夫语言ISO/IEC8859-6(Arabic)-阿拉伯语I

4、SO/IEC8859-7(Greek)-希腊语ISO/IEC8859-8(Hebrew)-希伯来语(视觉挨次)ISO8859-8-I-希伯来语(规律挨次)ISO/IEC8859-9(Latin-5或Turkish)-它把Latin-1的冰岛语字母换走,加入土耳其语字母。ISO/IEC8859-10(Latin-6或Nordic)-北日耳曼语支,用来代替Latin-4。ISO/IEC8859-11(Thai)-泰语,从泰国的TIS620标准字集演化而来。ISO/IEC8859-13(Latin-7或BalticRim)-波罗的

5、语族ISO/IEC8859-14(Latin-8或Celtic)-凯尔特语族ISO/IEC8859-15(Latin-9)-西欧语言,加入Latin-1欠缺的芬兰语字母和大写法语重音字母,以及欧元(€)符号。ISO/IEC8859-16(Latin-10)-东南欧语言。主要供罗马尼亚语用法,并加入欧元符号。接着宏大的中国人也开头用法上电脑了。中文可不得了,文字博大精深,字符远远超过了256个。所以我们无法用法ASCII的扩展了。怎么办呢?1981年的时候,国家派一批人来做了这个事情,他们统计出全部的中文也许有6000多个字符

6、(后来证明这些人的水品也是有限,好多字符都没有搜出来,于是就有了多种的中文编码),用两个字节(16bit)来表示,16bit能表示的是65536个字符,太够了。我们将16bit分为前8bit和后8bit假如前8bit小于127(英文ASCII),那么这个8bit就是表示英文假如前8bit大于127,那么这8bit和后面的8bit合起来表示一个中文GB是啥意思?国标。好了,后来某些领导发觉,他的名字没法编码了,这个问题出来了。6000个汉字还不足以囊括全部中文,国家在1995年又组织了一批人,连续搜罗一些生僻字,一共搜集出了2

7、1886个汉字和字符,形成了GBK编码,GBK编码向下兼容GB2312。K是啥意思?扩展。再后来发觉了,一些满文,蒙古文啥的少数名族的语言没有编辑到GBK中,连续编辑收录,形成了GB18030编码。中国___的人民当然不能用法大陆编辑用法的GBXX系列编码了,于是他们自己搞了一套BIG5中文编码,收录了13060个汉字和字符。但是这里要留意,BIG5的编码映射表和GBXX系列的就完全不一样了,比犹如一个“中”字,在BIG5和GB2312中就是两个完全不同的字节。这里就会有乱码消失了,比如("陶喆"和"陶吉吉"),各种简体中文

8、和繁体文的转码工具就消失了。BIG5是什么意思?五种中文套装软体:文书处理,资料库,试算表,通讯,绘图。大致的意思是这套编码主要用法于这5个领域各个国家用法各个国家自己的编码有没有很繁琐?于是大家很期盼有一种统一的编码形式消失。Unicode编码消失了。Unicode用法的通用的字符集叫做

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。