语言文字信息处理作业

语言文字信息处理作业

ID:34012534

大小:84.00 KB

页数:3页

时间:2019-03-03

语言文字信息处理作业_第1页
语言文字信息处理作业_第2页
语言文字信息处理作业_第3页
资源描述:

《语言文字信息处理作业》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、语言文字信息处理作业学号:2012210466姓名:李欣颖一、用国际音标写藏文扎西德勒、新春快乐、祝你开心每一天。1、扎西德勒[táciʔdèleʔ]2、新春快乐[sai44ʨhue44khuo31lau44]3、祝你开心每一天[ʨau55jaw31xɯ44sai44me31ji55thè44]二、用超星浏览器查阅《微机中文信息处理》.分析藏文和蒙古文的特征及关系;简述我国多种文字信息处理系统的设计思路并附图藏文特点:藏文是拼音文字,由30个辅音字母和4个元音符号构成,图10—6所示字体为仿照当时的某些梵文书体。拼写时,辅音字母按其在音节结构中的作用和位置分别称为“基字”、“上加字”、“

2、下加字”、“前加字”、“后加字”和“再加字”,其中前四个构成音节的辅音声母,后两个是辅音韵尾。元音符号不能用,表示i人。的符号写在“基字”上方,表示元音u的符号写在“基字”下方。音符号都不能单成音节,必须和辅音字母拼合(所以习惯上不叫“字母”,叫符号);元音符号的名称和发音不一致。辅音字母都能单成音节.单成音节时,发音都带有元音a,当辅音字母单成音节时,都带有固定的声调:N个读高调,16个读低调,并且其发音就是它的名称。藏文从左向右横写,“基字‘带“上加字”,“下加字”的复合声母用叠写的方式。音节之间用一小黑点作为分隔符号,分句符号用一垂直竖线,分章节符号为两条垂直竖线,全文或全书结束符

3、号用四条垂直竖线,另外在篇章开头还有专门的起始符号。字体分为印刷体和手写体两大类,形体差别比较大。藏文有统一的正字法,各个方百区又都有一套自己的语音与文字之间的读音规律,因此不同方言的人可以用共同的书面语进行交流。蒙古文特征:(1)蒙古文有5个元音和29个辅音字母。元音与辅音字母结合比较紧密,有的辅音字母因后续元音的性质不同,采用不同的字母形式。多数字母因处于词头、词中、词尾或单独出现的差别而有不同的变形;在设计荣文信息编码字符集和字母点阵信息字符集时,应该特别重视。(2)蒙文字母构成单词时,在垂直书写情况下,每个词除了词头和词尾的起笔位置和结笔位置比较自由外,其词头字母的结笔,词中字母

4、的起结笔以及词尾的起笔恢都必须起结于同一中心线位即主干上,互相不间断地笔画连成串,所以,蒙文在显示或打印时,要特别注意到以主干为中心线的连接问题。否则,将难以保证输出字形的质量。(3)蒙文字母长度不等。通常可分为长、中、短三种类型,其长度比例最少应分为3,2:1。若考虑到字体美观,应分为六种以上比例为宜。这个特点在字形点阵设计时要充分考虑。(4)蒙文字母并不是构成蒙文字形的最小单元,还可以向下进一步细分为20多种基本字元。利用这些基本字元可以组合拼成全部的蒙文字符。如表10—2所示,一个字母或一个音节可以分解为两个或两个以上的最简字元。我们一方面注意到利用这些字元来组成蒙文,另一方面也注

5、意到实际使用习惯。(5)蒙文的书写格式不同于西文和汉字的书写格式,其字向是自上而下的垂直方向,行向是自左向右的水平方向。因此,现行的显示设备和打印设备要进行适当的软硬件改造,才能处理蒙文。多种语言文字信息处理系统的思路:汉语是我国的国语。汉字是国内冬民族共同使用的重要交际工具,显然,少数民族语盲文字信息处理要相汉字信息处理兼容。但要指出的是,一般来讲,少数民族语言文字信息处理只要和汉字编码字符集基本集,即国家标准GB2312—80兼容就可以。了,一般不必和汉字辅助集兼容。事实上,根据我国各民族文字字符集数量少的特点,其编码字符集号可分为小字符集、中字符集和大字符集三大类。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。