ebmt系统中翻译模板抽取和匹配

ebmt系统中翻译模板抽取和匹配

ID:31976520

大小:1.68 MB

页数:63页

时间:2019-01-29

ebmt系统中翻译模板抽取和匹配_第1页
ebmt系统中翻译模板抽取和匹配_第2页
ebmt系统中翻译模板抽取和匹配_第3页
ebmt系统中翻译模板抽取和匹配_第4页
ebmt系统中翻译模板抽取和匹配_第5页
资源描述:

《ebmt系统中翻译模板抽取和匹配》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、大连理工大学硕士学位论文摘要传统的EBMT(Example—BasedMachineTranslation,基于实例的机器翻译)方法是建立在大规模的实例库基础之上的,存在着精确匹配率不高,模糊匹配时产生译文质量较差等缺点。利用翻译模板可以有效的解决翻译实例的数据稀疏问题、简化实例库的规模并提高实例匹配的精确率。本文研究了如何利用实例语料库自动获取翻译模板并在其基础之上进行模板匹配的方法。本文所定义的翻译模板是基于汉语浅层句法分析的,具体包括谓语中心词识别,介词短语识别眺及组块识别。浅层句法分析的优点是可以识别出确定性高的部分分析结果,减少句法分析中的歧义,从而降低

2、句法分析的难度。基于模板的翻译方法的核心问题是模板的抽取与匹配算法。本文在模板抽取过程中首先对翻译实例进行潜层句法分析,根据分析结果得到实例主架模板、介词短语模板以及组块模板。然后为每类模板确定一个中心词,利用中心词索引方式进行各类别模板的独立存储、索引关联,并进行系统模板库的构建。在模板匹配过程中首先对输入句进行模板抽取,然后在系统模板库中检索匹配模板。检索过程中兼顾模板的结构信息及语义信息,在保证模板主架结构相似的情况下再进行语义信息的匹配。匹配时分别以模板中心词作为静态阈值,模板距离及相似度得分作为动态阈值判断模板是否相似。在对由2386个实例构建的模板库分

3、别进行句子级的封闭测试及组块级的开放测试,准确率分别在94.98%及94.85%以上。实验结果表明,本文提出翻译模板抽取与匹配算法应用于EBMT系统中是可行的。最后,本文尝试在NiHao中日翻译系统中引入EBMT翻译引擎,对该引擎所使用的翻译模板规范、翻译工作流程进行了详细定义,取得了较好的实验结果。关键词:自然语言处理;机器翻译;EBUT;翻译模板大连理工大学硕士学位论文ExtractionandMatchingofTranslationTemplateinEBMTSystemAbstractEBMT(Example-BasedMachineTranslatio

4、n)systemsarebasedOnlargescaleexamplecorpusintraditionalhavingthedefectoflowprecisionofmatching.Translationtemplatecansolvetheproblemofdatasparsity,largestoragespaceandlowmatchingprecisionofexamples.TheresearchinthispaperfocusesOiltheautomaticTranslationtemplateextractionandmatchingbas

5、edOiltheexamplecorpus.Thetranslationtemplatedefinedinthispaperisbasedontheresultoftheshallowparsing.includingthemainverbidentification,prepositionalphraseidentificationandchunkparsin昏Shallowparsingcanrecognmemorereliabletusultthanfullparsing.andmakesfullsyntaxparsingeasier.Extractiona

6、ndmatchingoftemplatesalethemostimportantproblemsofTemplate‘BasedMachineTranslation.Theextractionmoduleextractsthesentenceframe,prepositionalphraseandchunktemplatesfiromtheresultofshallowparsing.Thetemplatesarestoragedindependtlyandlinkedbykeyword-lndexingindatabase.Thematchingmodulese

7、archesthemostsimilartemplateforinputsentcllceindatabase,withtheinformationofsyntacticstructureandlexicalmeaningofthes口

8、;Ia【K宅.Thetemplatesmatchingalgorithmgetsthesearchingresultbyusingkeywordasthestaticthreshold,distanceandsimilarityscoreasthedynamicthreshold.Theclosetestonsentencelev

9、eland

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。