规则与统计相结合的日语时间表达式识别与翻译研究

规则与统计相结合的日语时间表达式识别与翻译研究

ID:33888033

大小:1.74 MB

页数:50页

时间:2019-03-01

规则与统计相结合的日语时间表达式识别与翻译研究_第1页
规则与统计相结合的日语时间表达式识别与翻译研究_第2页
规则与统计相结合的日语时间表达式识别与翻译研究_第3页
规则与统计相结合的日语时间表达式识别与翻译研究_第4页
规则与统计相结合的日语时间表达式识别与翻译研究_第5页
资源描述:

《规则与统计相结合的日语时间表达式识别与翻译研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、≥参京交万方数据硕士学位论文规则与统计相结合的日语时间表达式识别与翻译研究J叩a11eseTimeExpressionRecognitionandTr肌slationBasedontheCombinationofRules锄dStatisticalModels作者:赵紫玉导师:徐金安北京交通大学2014年6月万方数据学位论文版权使用授权书I嗍㈣Y2734412本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,

2、并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。学校可以为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:垒蟛b\签字日期:卅l岬年]月弓日导师签名:g荔金穿、签字日期:勘cf年7月多日万方数据学校代码:10004北京交通大学硕士学位论文密级:公开规则与统计相结合的日语时间表达式识别与翻译研究JapaneseTimeExpressionRecognitionandTranslat

3、ionBasedontheCombinationofRulesandStatisticalⅣ【0dels作者姓名:赵紫玉导师姓名:徐金安学位类别:工学学科专业:计算机科学与技术学号:11120517职称:副教授学位级别:硕士研究方向:自然语言处理北京交通大学北尿父通大字2014年6月万方数据致谢本论文的工作是在我的导师徐金安教授的悉心指导下完成的,徐金安教授严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来徐金安老师对我的关心和指导。徐金安教授悉心指导我们完成了实验室的科研工作,在学习

4、上和生活上都给予了我很大的关心和帮助,在此向徐金安老师表示衷心的谢意。张玉洁教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。在实验室工作及撰写论文期间,刘江鸣、杨健、张静等同学对我论文中的研究工作给予了热情帮助,在此向他们表达我的感激之情。另外也感谢家人,他们的理解和支持使我能够在学校专心完成我的学业。万方数据j量塞交通太堂亟±堂僮途塞摘要传统的时间表达式识别方法主要分为两类:基于机器学习的时间序列标注方法和基于规则的方法。本文结合两种传统方法的优点,提出了一种规则与统计模型相结合的日

5、语时间表达式识别方法。该方法在按照Tirllex2标准对时间表现进行细化分类的基础上,结合日语时间词的特点,渐进地扩展重构日语时间表达式知识库,并对基于知识库获取的规则集进行优化更新,提高日语时间表达式的识别精准度;再融合cRF统计模型提高日语时间表达式识别的泛化能力。实验结果显示,本文提出的方法有效,它克服了传统方法可移植性差以及对语料库规模具有依赖性的缺点,可利用有限资源构建高质量识别日语时间表达式系统。在完成日语时问表达式识别工作后,我们进行了日语时间表达式翻译成汉语的工作。我们分别实现基于MoseS

6、翻译模型以及基于日汉时间基类关键词对平行字典与日语时间表达式翻译规则的翻译方法,分析二者实验结果,提出统计机器翻译(sMT)结合规则进行日语时间表达式翻译的方法。实验结果显示本文提出方法的翻译效果是三种方法中最好的。“规则和统计的融合”是本文的主要创新工作。我们利用错误驱动学习思想,根据统计模型的识别与翻译结果修正基于人工启发式的日语时间表达式识别规则模板与日汉时间表达式翻译规则模板,动态扩展重构知识库与日汉时间表达式平行字典,用更新后的规则模板、知识库以及日汉时间表达式平行字典实现基于规则的识别与翻译方法

7、,通过得到的结果来提高统计模型的训练语料质量,再进行统计模型识别工作与翻译工作。如此反复,直至系统的性能没有得到明显提高。我们提出的融合策略既提高了实验精度,又提高了系统的泛化能力。关链词:知识库;规则集;统计模型:统计机器翻译;日语时间表达式翻译规则;日汉时间表达式平行字典万方数据ABSTRACT1'raditionaltimeexpressionrecogn“iontedmologiesmaimyincludetimeserieslabelingmeⅡlodaJldrule-baSedmemod.In“

8、spaper,weproposeam劬odconsideringthecharac钯rofJap蕊esetimebasedonstatisticalmodel蠲drulesets慨g出enedbykno、vledgebase.AccordingtomeTiInex2stalldards’酎a11ularclassificationontimeexpression,weprogressivelyexpandandr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。