数字媒体及应用1

数字媒体及应用1

ID:37403157

大小:3.59 MB

页数:96页

时间:2019-05-12

数字媒体及应用1_第1页
数字媒体及应用1_第2页
数字媒体及应用1_第3页
数字媒体及应用1_第4页
数字媒体及应用1_第5页
资源描述:

《数字媒体及应用1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章数字媒体及应用5.1文本与文本处理5.2图像与图形5.3数字声音及应用5.4数字视频及应用5.1文本与文本处理5.1.1字符的编码5.1.2文本准备5.1.4文本编辑、排版与处理5.1.5文本的展现5.1.3文本的分类与表示5.1.1.字符在计算机中的表示西文字符的编码——ASCII码西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成美国标准信息交换码(AmericanStandardCodeforInformationInterchange,简称ASCII码):ASCII字符集包含96个可打印字符和32个控制字符采用7个二进位进

2、行编码计算机中使用1个字节存储1个ASCII字符存在问题:7位代码空间太小(只能对128个字符编码)不同国家和地区使用不同的字符集及其编码,互不兼容东亚地区使用的大字符集无法编码标准ASCII字符集及其码表b6b5b4b3b2b1b0012345670123456789ABCDEFb6b5b4b3b2b1b001101001101011常用的汉字编码字符集国家标准GB2312汉字扩充规范GBK国家标准GB18030台湾地区的标准汉字字符集CNS11643(BIG5,俗称“大五码”)日本工业标准汉字字符集JISX0208-90韩国国家标准汉字字符集KSC5601-8

3、7一级汉字(3755个)二级汉字(3008个)(扩充使用)字母、数字和各种符号………………19423位号…………191655568794区号(按汉语拼音排列)(按偏旁部首排列)GB2312汉字编码字符集1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980GB2312字符集由三个部分构成:拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个共6763个汉字和682个符号,每个汉字或符号都有一个确定位置,该位置的区号和位号就是这个汉字的“区位码”(注:区位码仅用于在键盘上输入汉字)GB2312汉字的编码每一个GB2312汉字使用1

4、6位(2个字节)表示每个字节的最高位均为“1”在16位代码空间中的码位分布:第1字节第2字节007EA1FE0081A1FEGB2312图形符号汉字代码空间(6763个汉字)B0F716位的代码空间共有216=65536个码位GB2312汉字编码的不足之处GB2312汉字字数太少,无法满足一些特殊应用的需要:人名、地名;古籍整理、古典文献研究。没有繁体字编码效率不高:(6763+682)/65536与ASCII码不兼容标准名称GB2312GBKGB18030UCS-2(Unicode)字符集6763个汉字(简体字)21003个汉字(包括GB2312汉字在内)270

5、00多汉字(包括GBK汉字和CJK及其扩充中的汉字)包含10万字符,其中的汉字与GB18030相同编码方法双字节存储和表示,每个字节的最高位均为“1”双字节存储和表示,第1个字节的最高位必为“1”部分双字节、部分4字节表示UTF-8单字节可变长编码UTF-16双字节可变长编码兼容性编码不兼容!几种汉字编码的对比GBK00FF00FF20902汉字00FF00FF6763汉字GB231200FF00FF27484汉字GB18030编码保持向下兼容例:IE浏览网页时文字编码的选择5.1.2.文本准备——文稿如何输入计算机文字符号输入计算机的方法键盘输入自动识别输入字符

6、信息的输入人工输入(1)数字编码,如电报码、区位码等,(2)字音编码,如智能ABC等(3)字形编码,如五笔字形和表形码等,(4)形音编码发展趋势:基于统计和学习功能的以词语(短语)或句子作为输入单位的输入方法文字符号输入计算机的方法键盘输入联机手写输入自动识别输入字符信息的输入人工输入优点:自然,流畅小型化,适合移动计算不足:识别速度和正确性还需提高书写要求还要降低文字符号输入计算机的方法键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入优点:自然,方便,适合移动计算不足:对说话人、说话方式、说话内容的适应能力要大大增强识别速度和正确性还需大大提高文字

7、符号输入计算机的方法印刷体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入扫描仪OCR数字文本纸介质文本文本的映象(image)识别率已达到98%功能:简、繁体字混合识别中文、西文混合识别文字、表格混合识别智能校对功能文字符号输入计算机的方法印刷体识别手写体识别键盘输入联机手写输入语音输入自动识别输入字符信息的输入人工输入技术上非常困难,还无法实用目前准备先突破工整的楷书手写体的识别!汉字键盘输入方法的比较类型原理举例优点缺点数字编码使用一串数字来表示汉字电报码区位码仅使用10个数字键难记忆字音编码把汉语的拼音作为汉字的输入编码智能ABC紫光微软

8、拼音输入简

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。