机器翻译方法课件.ppt

机器翻译方法课件.ppt

ID:57047747

大小:276.00 KB

页数:56页

时间:2020-07-28

机器翻译方法课件.ppt_第1页
机器翻译方法课件.ppt_第2页
机器翻译方法课件.ppt_第3页
机器翻译方法课件.ppt_第4页
机器翻译方法课件.ppt_第5页
资源描述:

《机器翻译方法课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、人工智能与机器翻译——机器翻译部分主讲:杨宪泽机器翻译的处理对象是自然语言,而人类对于语言认知的过程还未研究清楚,因此,要实现理想、高质量的机器翻译至少目前还有较大的距离。机器翻译是21世纪要解决的科技难题之一,主要困难是自然语言在各个层次上的歧义性。解决歧义问题很难从根本上突破,它将涉及到处理的难度和翻译的速度,翻译的复杂性,因此,寻求简单的翻译方法是一个重要课题,它可以降低歧义处理难度,增加解决这一科技难题的希望。第4章机器翻译方法自然语言的机器翻译目前一般以句子为翻译单位。句子又分为句、短语、词三个层次。分析阶段一般分为词法分析、句法分析、语义分析、语

2、境分析、语用分析等,其中以词法分析和句法分析为主。面对这么多而复杂的分析模块(机器翻译中,每一种分析组成一个软件模块),面对这么庞大的软件系统,研究者必须有清晰的思维、正确的切入点,才可能把翻译软件设计得好一些,再好一些。基于这样的认识,本章将首先讨论现有的机器翻译方法,并把重点放在基于实例的机器翻译上。人作翻译时,把一个源语言句子译成目标语言句子,涉及到四个基本操作:目标语言单词的检索、调序、删词、增词;机器翻译系统的操作过程也不例外,有检索、分析、转换和生成的主要四个阶段。这被称为基于分析和转换的机器翻译系统。也被认为是模拟人类翻译活动最恰当的机制。基于

3、分析和转换的机器翻译方法就是自动实现源语言到目标语言的转换,它采取了一系列的分析和转换的生成层次,使一个源语言句子经过不同的中间表达形式,最终达到目标语言句子的表示。其目的是尽可能地加深对源语言的理解,生成尽可能恰当的目标语言形式。这种方法比较全面地体现了语言学知识在机器翻译中的应用,是了解机器翻译实现过程的非常合适的模式。4.1机器翻译的四种实现方法4.1.1基于分析和转换的机器翻译方法在“机器翻译的常规步骤”实际上已经慨略的介绍了这一方法的全过程,这里再补充阐述一些内容:句子经过分析阶段之后,进入转换和生成阶段。这两者一般联系得比较紧密,有时无法严格区分

4、,因为转换到目标语言也就是要生成目标语言的词汇、短语、句子。可以把句子结构的转换也就是源语言的句法树转换长合适的目标语言对应形式当作转换,而后续的许多处理都当作生成阶段的处理步骤看待。实质上,机器翻译方法对语言的处理就是在两种语言之间搭一座桥,实现一种语言到另一种语言意义等价的转换。它并非象自然语言理解那样只是对一种语言的操作,只需作针对一种语言的分析。作为一个机器翻译系统,它既要考虑源语言的语法和语义规律,也要考虑目标语言的这方面规律,忽略了任何一方都是不行的。也就是说,对于双语互译规律的发现和应用才是机器翻译最本质的特征。所以,在词、短语和句子这三个层次

5、上寻找源语言的目标语言翻译的等价物是机器翻译中转换与生成的任务。通常,机器翻译的研究中将转换看做整个翻译过程中的一个阶段。然而,在语义结构上进行转换却是一种好的方式。语义结构可以是跨语言的,有能力同时应用于分析和生成。另一方面,当机器翻译系统的翻译语言对扩展时,还可以应用于多种不同的语言。但要注意,大规模的自然语言语义描述相当复杂,因而在机器翻译系统中的应用往往会受到限制,难以采用这样的语义表示作为转换的基本结构。一般情况下,分析以句法为主、语义为辅,正确的句法结构转换加正确的词汇译文可以从源语言向目标语言传递完整的正确信息。因此,以句法结构转换附加上一定的

6、语义信息,能够构成转换的基本层次。不足之处是:因为句法分析的结果是面向源语言的,而要生成合适的目标语言译文,转换部分常常引入许多目标语言方面的约束,使得转换规则变得复杂了。就标准的机器翻译系统来说,句子和短语层次的结构转换是机器翻译转换部分的研究重点。通常使用转换规则,就可以实现源语言句法结构到目标语言句法结构的转换。这方面一般采用产生式方式的转换规则形式:S:S1+S2+…+Si→T1+T2+…+Tj:T上式理解为:S是SL(源语言)的某个待翻译单位(句子、短语等等),S1~Si是S中的下一级组成单位;对于S,如果满足条件

7、>,则TL(目标语言)中有T1~Tj译文构成了相应的等价物T。这样的方法有两个特点:一是面向源语言分析,因为源语言中的一个句子已经由句法、语义分析等阶段分析完毕,生成了关于源语言句子的某种中间表示,转换以这种源语言中间表示作为输入;二是直接转换,即对于S表示,直接给出译文形式,一般不需要在目标语言内再作进一步转换,T1~Tj可以直接包括目标语言的词汇,也可以是对应于S1~Si的译文组块。上述方法称为基于句法的转换方法,因为S1+S2+…+Si一般来说就是源语言的的句法结构表示;也可以称为直接转换方法,因为对于每个源语言的翻译组块,都马上给出一个目标语言组块与

8、之对应。应该说,这种转换方法符合人的直觉认识,也能够

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。