文字及其处理技术.ppt

文字及其处理技术.ppt

ID:51973796

大小:2.21 MB

页数:29页

时间:2020-03-26

文字及其处理技术.ppt_第1页
文字及其处理技术.ppt_第2页
文字及其处理技术.ppt_第3页
文字及其处理技术.ppt_第4页
文字及其处理技术.ppt_第5页
资源描述:

《文字及其处理技术.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、§4.1文本信息加工4.1.1文字及其处理技术第四章文本和表格信息加工云南纳西族东巴文字猜猜看,上面的象形文字究竟表示什么意思?结绳说图画说仓颉造字说一、体验文字处理技术1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。一、体验文字处理技术1.文字是人类为了更加流畅地表述意义、传递经验而发明的工具。甲骨文殷周时代金文西周、春秋战国文字春秋战国小篆秦朝隶书秦朝楷书东汉行书南北朝草书西汉印刷字体宋朝2.汉字的创造饱含民族的智慧汉字起源于象形文字,至今仍然保留了象形文字的特点。汉字的造字法有四种:象形、指事、会意、形声。从

2、字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。象形指事金文「明」为日月幷照之会意字。会意形声形声字的一部分是“形旁”表示字义,一部分是“声旁”表示读音,如:“鸽”是“鸟”形“合”声,“河”是“水”形“可”声。3.书法是一种凝结了我国民族文化精髓的特殊的艺术形式兰亭集序(局部)晋·王羲之徐冰—方块英文将26个字母改造成类似中国汉字的偏旁部首ArtForThePeople一、文字及其处理技术历史上使用的文字处理技术,请按时间顺序排列:①活字印刷;②机械式打字机;③

3、手写;④雕版印刷;⑤刻字;⑥计算机文字处理手写刻字雕版印刷活字印刷机械式打字机计算机文字处理从古代的到现在Tiyanqingjing:pinyinyuhanzi体验情境:拼音与汉字村居(清)高鼎草长莺飞二月天, 拂堤杨柳醉春烟。 儿童散学归来早, 忙趁东风放纸鸢。字符的编码ASCII码美国信息交换标准代码(AmericanStandardCodeforInformationInterchange,ASCII)o6F11101101111n6E11001101110m6D10901101101l6C10801101100k

4、6B10701101011j6A10601101010i6910501101001h6810401101000g6710301100111f6610201100110e6510101100101d6410001100100c639901100011…..…..…..…..十进制数二进制数十六进制数字符00000000000000010000001000000011++1+11……0123011111111270123456789ABCDEF0123456789101112131415十六进制数的表示一个十六进制数需要四个二进制

5、数表示F=1111E=1110D=1101C=1100B=1011A=10109=10018=10007=01116=01105=01014=01003=00112=00101=00010=00001个字符需要8位二进制数即8个比特(Bit)而1个字节B(byte)=8比特(Bit)即一个字符需要一个字节来存储汉字的输入方法汉字的输入方法目前有两大类四种: (1)键盘输入法。利用各种汉字输入方法的编码敲击键盘来输入汉字; (2)非键盘输入法。目前主要有三种方法:手写笔输入,语音输入,扫描识别输入二、汉字的编码1.用于输入汉字的

6、编码——输入码(外码)编码方案:区位码、拼音码、王码、自然码编码类型:①音码:将汉字与读音建立对应关系进行编码的方法如:全拼双音、双拼双音②形码:将汉字的字形按笔画或组合进行编码的方法,如:王码、郑码、表形码③数字码:将汉字与数字对应的编码方法。如:区位码简介④混合码:将汉字的字形和字音相结合的编码方法。如:自然码2.用于存储汉字的编码——机内码(内码)汉字的机内码是供计算机系统内部、加工处理、传输而统一使用的代码。国际码(GB)也叫GB国际码,简称国际码1980年,国家标准局颁布了《信息交换用汉字编码字符集基本集》(代号为G

7、B2312-80),这是国家标准汉字编码。输入码(外码)机内码(内码)自动寻找对应二、汉字的编码大五码(Big5)又称为五大码,是使用繁体中文社群中最常用的电脑汉字字符集标准,共收录13,060个中文字,其中有二字为重覆编码,Big5属中文内码(中文码分为中文内码及中文交换码两类)。Big5虽普及于台湾、香港与澳门等繁体中文通行区,但长期以来并非当地的国家标准,而只是业界标准(defactostandard)。倚天中文系统、Windows等主要系统的字符集都是以Big5为基准,但厂商又各自增删,衍生成多种不同版本。Unicod

8、e(统一码、万国码、单一码)一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。随着计算机工作能力的增强,Unicode也在面世以来的十多年里得到普及。练习

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。