D7:56?234567894:78;7<=4=>=36?.3@A76568B/O0,C’((’文章编号:!"#!$%"#&(’((’)()$((%*$(+面向机器翻"> D7:56?234567894:78;7<=4=>=36?.3@A76568B/O0,C’((’文章编号:!"#!$%"#&(’((’)()$((%*$(+面向机器翻" />
面向机器翻译系统句法分析器的研究与实现.pdf

面向机器翻译系统句法分析器的研究与实现.pdf

ID:52287167

大小:233.02 KB

页数:5页

时间:2020-03-26

面向机器翻译系统句法分析器的研究与实现.pdf_第1页
面向机器翻译系统句法分析器的研究与实现.pdf_第2页
面向机器翻译系统句法分析器的研究与实现.pdf_第3页
面向机器翻译系统句法分析器的研究与实现.pdf_第4页
面向机器翻译系统句法分析器的研究与实现.pdf_第5页
资源描述:

《面向机器翻译系统句法分析器的研究与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第!"卷第)期黑龙江工程学院学报V65,!"CW6,)’((’年&月X6>D7:56?234567894:78;7<=4=>=36?.3@A76568B/O0,C’((’文章编号:!"#!$%"#&(’((’)()$((%*$(+面向机器翻译系统句法分析器的研究与实现孟遥!,赵铁军’,李生’(!,黑龙江工程学院计算机科学与技术系,黑龙江哈尔滨!+(((*;’,哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨!+(((!)摘要:自然语言句法分析是机器翻译不可缺少的前期处理过程,文中总结了几代机器翻译系统中句法分析的经验,在最新研制的英汉双向机器翻译系统-./’(((中设计并实现了一个模块化的

2、统计与规则相结合的句法分析模型。整个句法分析采用综合的策略,分别使用了隐马尔可夫方法、统计决策树方法、基于历史的句法分析等多种方法,并注意语义知识在句法分析中的应用。实验结果表明,模块化的句法分析器的设计方法,不论是对英语句法分析还是对汉语句法分析都是一种可取的方法。关键词:句法分析,统计与规则,机器翻译中图分类号:.0)&!,’文献标识码:1!"#"$%&’()*$%#+),-"&’)(.(,/+)0$&’+)"-%$)#.$1+()2/#1"3!"#$%&’!()*+,-./0123’(4567/38’!"#234567894:78;7<=4=>=36?.3@A76568BC2:DE4

3、7!+(((*CFA47:G’,$%&’’(’)*’+,-./0$%1/2%/34/%&2’(’567890:12;2<.1.-./’)4/%&2’(’567890:127"=>>>"CFA47:H45#1%$&160:D<4784<:@37=D:5ID6E53J?6DJ:7B=:D:55:78>:83ID6@3<<478C35:

4、DI:D<3D><478@6JE47:=4676?<=:=4<=4@:7ND>53J3=A6N<,;=47=38D:=3<<3M3D:5<=D:=3843<47@5>N47824N3-:DK6MJ3=A6NC<=:=4<=4@N3@4<467=D33CA4<=6DB$E:<3NJ3=A6N<:7N3JI56B<<3J:7=4@47?6DJ:=46747=A3:586D4=AJ,OLI3D4J37=:5D3P<>5=<47N4@:=3=A:==A4<:IID6:@A4<<>@@3<547E6=AO7854

5、4<=4@D>53GJ:@A473=D:7<5:=467C分析器Q赵铁军等,!&&+R、采用概率STU算法的英!双向机器翻译与句法分析语句法分析器Q赵铁军等,!&&*R以及采用渐近式处机器翻译系统的研究与开发离不开对源语言理策略的中英文句法分析器。在研发过程中,我们的分析和理解,句法分析是源语言分析的关键步的总体方法也实现了从基于规则方法到基于语料骤。哈尔滨工业大学机器翻译研究室多年来在汉语库方法的过渡。这一过程可以用图!表示。和英语的句法分析方面进行了一系列探索,先后实下面简要回顾一下我们实现的各种句法分析现了采用复杂特征集操作的确定性汉语句法分析器的特点。器Q赵铁军等,!&&’R、基于

6、模式匹配的中英文句法采用复杂特征集操作的确定性汉语句法分析收稿日期:’((’$(%$!#基金项目:黑龙江省教育厅科研基金资助项目(!(+!!!#&)。作者简介:孟遥Y!&#(ZH,女,黑龙江工程学院计算机科学与技术系讲师,研究方向:计算机应用。第!期孟遥等:面向机器翻译系统句法分析器的研究与实现>K6>规模的知识获取的困难。¡¢£¤¥¦§¡¢¡¢采用概率+,-算法的英语句法分析器应用¡¢£¤¡¢£¤于(%)*!&’’英汉机器翻译系统中,其初衷是解决源语言分析中存在的各种歧义。因为当时我们尚没¡¢£有采用词性标注技术,采取了部分规则来消除词性¡a¡¢£¤¥¦§¨©ª兼类,考虑到+,-算法具有

7、一定的词性消兼的能力.%/0123456)*7,因而使用了概率+,-算法。其¡¢£¤¥¦§¨¡¢¡¢中概率数据来自我们利用该分析器(初始不带概率¡¢£¤/¡¢£¤¡¢£¤¡¢£¤而由人工选择正确的句法树)分析得到的约8999个英语句子的句法树。在规则消兼之后,分析器还¡¢¡¢£¡¢£¤¥¦§进行了基于规则的部分:;识别。尽管该分析器分为几个阶段,但是由于整个句法分析基本在+,-¡b¡¢£¤¥¦§¨©ª算法阶段实现,使得句

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。