TH-OCR使用说明

TH-OCR使用说明

ID:37155175

大小:807.50 KB

页数:10页

时间:2019-05-19

TH-OCR使用说明_第1页
TH-OCR使用说明_第2页
TH-OCR使用说明_第3页
TH-OCR使用说明_第4页
TH-OCR使用说明_第5页
资源描述:

《TH-OCR使用说明》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、紫光文字识别软件一、软件说明紫光以清华大学电子工程系为技术依托,隆重推出“基于识别的原文重现”自动电子出版物制作系统(TH-OCR紫光专业版)。该系统通过了国家教育部组织的专家鉴定会的鉴定。该出版系统是国内外首次推出的能同时识别超大字符集(13051字)和超多种汉字字体(近百种)、并且将电子文档的错误率降低到万分之一以下的、能将复杂报纸杂志文档经版面分析、识别、理解,最后自动精确重构为原式原样的标准格式电子文档的电子出版系统,为我国信息资源建设提供了一个快捷、高效的系统解决方案,是一个具有划时代意义的创举。TH-OC

2、R紫光专业版是一套理想的中英文印刷体自动识别系统,可广泛应用于办公自动化的资料录人、文献建档、资料处理、信息管理、智能翻译等领域。二、软件操作注意:随紫光扫描仪一起赠送的TH-OCR紫光专业版,需要与紫光扫描仪配套使用,请在正确安装紫光扫描仪之后使用。1、软件界面及功能说明在不同的操作状态,分别有图像版面分析和编辑修改两种界面。软件界面一:图像版面分析界面软件界面二:编辑修改界面后改编工具条工具条中各快捷作按钮的功能说明如下:打开扫描打印识别倾斜校正旋转图像缩小竖排正文图形图像全部识别导出版面分析放大横排正文表格识别

3、字体复制撤消前向词汇相似字帮助剪切粘贴查找逆向词汇常用符号2、操作流程TH-OCR紫光专业版的操作流程分为设置、获取图像、版面分析、文字识别、编辑修改等五步,如图所示:设置使用系统前应根据应用环境及需求设定系统参数。从“命令”菜单选择“设置”命令,在打开的“设置”对话框中可对系统、扫描、识别、后编改及其它(表格、版面分析等)参数进行设定。这些参数一般按默认设置即可。获取所要识别的图像文件获取所要识别的图像文件有两种方式:通过扫描仪扫描新的图像或打开已有图像文件。如果要扫描新的图像,则应从“文件”菜单选择“扫描”命令或

4、单击工具条上的扫描图标,对所要识别的稿件进行扫描。扫描完成后退出扫描界面。识别后,文件将不直接出现在识别界面中,双击被识别图像文件左边的“+”号,出现识别后的文件名,双击该文件名,即可打开该文件进行编辑修改,当文件为横排时,右侧上部为识别后文本窗口,右侧下部为局部图像窗口;当文件为竖排时,识别后文本窗口和识别前局部图像窗口左右排列,如下图:对于磁盘上原有保存好的图像文件,可以直接从“文件”菜单中选择“打开”命令或单击工具条上的打开图标,在“打开”对话框中指定路径、文件类型、文件名,单击“打开”按钮,即可将选定的图像文

5、件显示在工程管理窗口。同Windows的操作一样,如要一次打开多个文件,请使用“Ctrl”或“Shift”按键选择相应文件打开即可。图像文件打开后,显示在图像窗口中,与扫描得到的图像相似。打开多个文件进行识别时,所识别得到的文本作为工程将按选中文件列表中的文件顺序排列在工程管理窗口。提示:扫描仪的操作请参照随同扫描仪附送的用户手册的指导。注意:1.TH-OCR紫光专业版可以识别彩色、灰度和黑白二值的图像,扫描时的扫描模式可任意设置。2.对普通书本的印刷质量,字号在5号以上的印刷材料,可适当选择其扫描分辨率为300dp

6、i,扫描亮度为自动或默认值;3.对已有的图像文件,要注意其图像存储格式是否符合TH-OCR紫光专业版系统的要求(非压缩TIFF格式、PackBit或G4压缩的TIFF格式、BMP格式或PCX格式)。进行图像版面处理对扫描所得图像文件根据需要进行处理(旋转、反转、剪裁、倾斜校正等)和版面分析等,并选择需识别的内码、字体,为识别做好准备。注意:对于比较简单的结构,可以使用自动版面分析,如果版面较复杂,请手工进行版面分析,只需简单地用鼠标框选各识别区域,并根据原稿的版式选择要进行文字识别的区域的属性,如:横排正文、竖排正文

7、、表格、图形等。如果不选择,则认为是对整篇图像进行识别。在对整篇图像进行识别时,识别区域中不能包含有图形。从“命令”菜单选择“识别”命令或单击工具条的识别按钮,完成版面的识别。完成后,双击被识别图像文件之后,再双击识别后的文件名,进人编辑修改状态。在编辑修改状态,对于正常识别的文字用黑色显示,对于可疑字用系统设置中指定的颜色显示(默认为红色),便于提示修改。系统提供Windows标准的编辑操作和TH-OCR紫光专业版系统特有的编辑功能。Windows标准的编辑操作包括剪切、复制、粘贴和清除等,TH-OCR紫光专业版系

8、统特有的编辑功能主要包括前向词汇、逆向词汇、相似字、常用符号、和行逆序。通过双击项目管理窗口的原图形文件和被识别后文件,可以在图像状态和编辑状态间切换。识别结果输出识别结果经修改编辑后,可根据需要输出。●存盘:从“文件”菜单选择“另存为”命令,在“另存为”对话框中指定文件名后将文本以其它文件名保存。●导出:从“文件”菜单选择“导出”命令,在“导

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。