基于UNICODE的多语言处理平台的研究与实现

基于UNICODE的多语言处理平台的研究与实现

ID:39401808

大小:867.00 KB

页数:118页

时间:2019-07-02

基于UNICODE的多语言处理平台的研究与实现_第1页
基于UNICODE的多语言处理平台的研究与实现_第2页
基于UNICODE的多语言处理平台的研究与实现_第3页
基于UNICODE的多语言处理平台的研究与实现_第4页
基于UNICODE的多语言处理平台的研究与实现_第5页
资源描述:

《基于UNICODE的多语言处理平台的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、北京邮电大学硕士学位论文基于UNICODE的多语言处理平台的研究与实现姓名:董治江申请学位级别:硕士专业:信号与信息处理指导教师:钟义信20040220北京邮1U人学坝J,学位论文基于UNICODE的多语言处理、卜台的研究1i实现统地总结了复杂文本语言文字的处理需求,也分析了传统字体技术(TrueType、Typel等)在处理复杂文本语言的缺陷与不足,在此基础上引出了OpenType字体技术,这种字体技术为复杂文本语言的处理提供了一套完整的解决方案,在本章的最后部分指出了制作民文OpenType字库的几个关键点:对于这样一个复杂的字体技术,对应的有~个处理模

2、块来驱动它,这个处理部分我们称之为布局引擎(LayoutEngine),布局引擎控制着字体(在此表示OpenType字体)提供的功能来满足对复杂文本语言处理的需求,本论文通过研究两个开源的布局引擎ICU和Pango的源代码,在分析印度文字、阿拉伯文字的处理过程的后,在第四章中提出了处理复杂文本语言的一般流程,并详细阐述了处理多语言文字的整个流程的原理和各个组成部分的功能,尤其是复杂文本语言的处理模块——布局引擎。在本章最后,阐述了OpenOffice的多语言处理模块实例,并对其在Linux平台上使用的布局引擎一ICU做了重点的分析,提出了如何在ICU中实现完

3、全支持ISO/IEC10646和Unicode标准的蒙古文文字和维文的布局引擎。本论文的创新之处是在国内首次提出以OpenType字体技术来实现对少数民族文字的处理,并分析和阐述了OpenType的布局引擎的工作原理,提出了完全遵循Unicode国际标准的少数民族文字的处理方法。关键词:多语言处理复杂文本语言OpenType字体技术布局团擎II北京邮I乜大学烦士学位论文基于UNICODE的多语苦处理’P台的研究。j实j见MUIJI.SCRIPTPROCESSINGPLALTFoRMRESEARCHANDIMPLEMENl渔TIoNBASEDoNUNICoDE

4、AbstractForthemodemoperatingsystemandlargerapplicationsoftware,multi-Languageisnotonlyanecessaryrequirement,butalsoaIlimportantfeature.ItisveryeasyforcomputertoprocessLatinandHanscript,butforsomeotherscripts,suchasIndian,ArabianscriptsandMongolian,Tibetanscripts,theprocessbecomesre

5、allycomplex.Theboric・neckproblemisthatvariationsofpresentationcharactershavenodefinitecodepoints.ThatiswhymanysoftwaresystemsprocessingminorityscriptsareproducedinrepetitionandareincompatiblewitheachotherinChina.ManycompaniesalwaysaddthevariationsofpresentationcharactersinUnicode.I

6、nthiscase,webreakthestandard.So,itiSverynecessarytoresearchprocessingcomplextextplatformbasedonISO/IEC10646andUnicode,whichisthekeytodevelophighqualitysoftwareofminoritylanguages.Thispaperisbasedonthisrequirement,researchonthemulti—languageprocessingplatform,especiallythecomplextex

7、tprocessingplatform.Firstly,mypaperillustratestheconceptsofsoftwareintemationalization(118n)andlocalization(LlOn),andanalyzesthe118nandLlOnmechanismsofLinuxandOpenOffice.Then,thecorefactorsofprocessingmulti-language,CharacterSetandCharacterencodingscheme,especiallytheISO/IEC10646an

8、dUnicode,willbeintroduced.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。