多媒体文本信息的处理技术.ppt

多媒体文本信息的处理技术.ppt

ID:52305486

大小:579.06 KB

页数:26页

时间:2020-04-04

多媒体文本信息的处理技术.ppt_第1页
多媒体文本信息的处理技术.ppt_第2页
多媒体文本信息的处理技术.ppt_第3页
多媒体文本信息的处理技术.ppt_第4页
多媒体文本信息的处理技术.ppt_第5页
资源描述:

《多媒体文本信息的处理技术.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多媒体文本信息的处理技术多媒体技术文本信息的获取与表现文本信息是我们最熟悉的媒体形式,它是由字符组成的字符序列。文字可以先利用扫描仪以图像的方式扫入计算机,然后利用ocr软件进行识别。多媒体表达信息的方式在时间轴上对多媒体信息进行编辑和剪裁在空间上安排多媒体信息,共同表达事物,做到“声、文,图”一体化。超文本超文本:采用一种非线性的网状结构组织块状信息,没有固定的顺序,也不要求读者按某个顺序来读。超文本把文本按其内部固有的独立性和相关性划分成不同的基本信息块,称为结点(node)。结点之间按它们的自然关联,用链连接成网,链的起始结点称为

2、锚结点,终止结点称为目的结点。——————————————————————定义:超文本是由信息结点和表示信息结点间相关性的链构成的具有一定逻辑结构的语义的网络。超链接(hyperlink)指文本中的词、短语、符号、图像、声音剪辑或影视剪辑之间的链接,或者与他的文件、超文本文件之间的链接,也称为"热链接"。超媒体不仅可以包含文字而且还可以包含图形、图像、动画、声音、和电视片断,这些媒体之间也是用超链接组织的,而且它们之间的链接也是错综复杂的。超媒体与超文本之间的不同之处超文本主要是以文字的形式表示信息,建立链接关系主要是文句之间的链接关系

3、。超媒体除了使用文本外,还使用图形、图像、声音、动画和影视片断等媒体之间的链接关系。文本格式RtfRTF是RichTextFormat的缩写,意即多文本格式。对普通用户而言,RTF格式是一个很好的文件格式转换工具,用于在不同应用程序之间进行格式化文本文档的传送。通用兼容性应该是RTF的最大有点,但同时也就具有它的缺点,比如文件一般相对较大(嵌入了兼容各种应用程序的控制符号)、WORD等应用软件特有的格式可能无法正常保存等。文本格式PDF全称PortableDocumentFormat,是Adobe公司开发的电子文件格式。这种文件格式与操

4、作系统平台无关。。PDF文件格式可以将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件中。该格式文件还可以包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。Pdf文件的制作与读取Pdf读取:adobeacrobatreader(免费)Pdf制作及修改:adobeacrobat(收费)Acrobat的安装下载完成后,会出现一个压缩包,然后进行解压,就是出现一个文件夹,如下图Acrobat的安装打开AdobeAcrobat7.0文件夹,选择AcroPro.msi软件,进行安装。如下图Acr

5、obat的安装打开AcroPro.msi软件后,下面就直接进行入AdobeAcrobat7.0Professional安装程序。选择下一步,如下图Acrobat的安装下面会出现欢迎使用AdobeAcrobat7.0Professional安装,选择下一步,如下图Acrobat的安装下面会出现选择最终用户许可协议的语言版本,选择简体中文,然后选择下一步,如下图Acrobat的安装下面会出现最终用户许可协议,选择接受,如下图Acrobat的安装下面会出现用户信息,请输入用户名、单位、序号,输入完成后,选择下一步,如下图显示Acrobat的安

6、装下面会出现缓存安装程序,在缓存栏上选择打匀,安装缓存安装程序文件。选择下一步,如下图显示Acrobat的安装下面会出现PDFMAKER安装和集成信息,选择下一步,如下图下面会出现安装类型,选择典型,选择下一步,如下图使用acrobat制作电子书文本的转换图像的转换文字识别软件OCR是英文Optical Character Recognition的缩写,意思为光学字符识别,通称为文字识别,它的工作原理为通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储

7、在文本文件中,由此可以看出,OCR实际上是让计算机认字,实现文字自动输入。它是一种快捷、省力、高效的文字输入方法。Ocr软件紫光文通OCR汉王OCR丹青OCRRapidScan高速扫描影像优化OCR识别系统MiniOcr汉字显示字体识别软件奥普印刷体文字识别OCR系统、OCR SDK开发包TypeReader6.0WebOCR1.0 (Beta2)Tiger OCR SDKTh-ocrTH-OCR是清华大学自1985年就开始研发的,TH是TsingHua(清华)的缩写,TH-OCR代表北京清华紫光文通信息技术有限公司开发的OCR软件,从

8、1.0版本开始已经升级到现在的9.0版本。独家真正实现了汉英混排同时识别,在国际上首次突破了OCR产品只能处理汉字或英文单一文字的局限性,新增了东方文字(简繁汉、日文、韩文)识别功能,对日文和韩文与英文混排

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。