依存句法分析置信度的研究

依存句法分析置信度的研究

ID:32246629

大小:2.30 MB

页数:62页

时间:2019-02-02

依存句法分析置信度的研究_第1页
依存句法分析置信度的研究_第2页
依存句法分析置信度的研究_第3页
依存句法分析置信度的研究_第4页
依存句法分析置信度的研究_第5页
资源描述:

《依存句法分析置信度的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP391.2学校代码:10213国际图书分类号:681.37密级:公开工工工学学学硕硕硕士士士学学学位位位论论论文文文依存句法分析的置信度研究硕士研究生:郭江导师:车万翔副教授申请学位:工学硕士学科:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2012年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.2U.D.C:681.37DissertationfortheMasterDegreeinEngineeringRESEARCHONCONFIDENCEMEASUREINDEPENDENCYPARS

2、INGCandidate:GuoJiangSupervisor:AssociateProf.CheWanxiangAcademicDegreeAppliedfor:MasterofEngineeringSpecialty:ComputerScienceandTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2012Degree-Conferring-Institution:HarbinInstituteofTechnology哈尔滨工业大学工学硕士学位论

3、文摘要句法分析是自然语言处理的核心问题,对信息抽取、信息检索、机器翻译等应用有重要的支撑作用。依存句法以其形式简洁、易于标注、便于应用等优点为人所重视。虽然目前依存句法分析算法研究取得了一定的进展,但是其准确率仍然不能满足实际应用的需要。针对这一问题,本课题并没有将全部研究重点放在提高依存句法分析的准确率上,而是提出了对依存句法分析结果进行置信度分析这一新问题,通过对依存句法树中每条依存弧的置信度进行计算,将置信度高的依存搭配用于特定应用系统,从而提高这些系统的准确率。目前主要有两种主流的依存分析机制,一种是基于转移的依存分析,另一种是基于图的依存分析

4、。针对这两种依存分析方法的不同,本文提出了相应的计算置信度的方法。基于转移的依存分析通过构造优化的转移序列来对句子进行解码,从而生成一棵依存句法树。其学习方式有局部学习(LocalLearning)和全局学习(GlobalLearning)两种方式。针对局部学习的转移模型,本文提出基于似然概率以及基于重采样的置信度计算方法;针对全局学习的转移模型,本文提出基于K-Best结果投票的置信度计算方法。基于图的依存分析通过寻找最大生成树的方法获取一个句子的依存分析结果。其学习过程一般使用在线学习(OnlineLearning)算法。依存分析的图模型一般为线性

5、模型,因此与基于转移的依存模型不同,其无法直接得到一条依存弧的似然概率。针对这一问题,本文首先利用图模型的输出近似估计依存弧的边缘概率,并以此作为该依存弧的置信度。同时,本文提出一种有指导的基于Logistic回归的置信度估计方法,该方法能够充分地利用更丰富的特征,并且通过有效的学习方式对特征进行赋权。另外,本文还提出了若干种置信度估计的评价方法,一方面可用以评价置信度计算结果的优劣,另一方面也为置信度计算提供了优化目标。最后,本文将含有置信度的依存句法分析结果应用于篇章级情感分析以及半指导依存句法分析,以观察其有效性。实验结果证明,对置信度信息的合理

6、应用能够在一定程度上提高上层应用及依存句法分析自身的性能。关键词:依存句法分析;转移模型;图模型;置信度-I-哈尔滨工业大学工学硕士学位论文AbstractThesyntacticparsingisthecoreissueofnaturallanguageprocessing.Itcansupportlotofapplications,suchasinformationextraction,informationretrieval,andmachinetranslations.Thedependencyparsing,withitssimplegram

7、maticalform,easy-tagging,andfacilitateapplications,haverecentlygainedawideinterest.Althoughthedependen-cyparsinghasmadesomeprogressrecently,itsaccuracyisstillunabletomeettheneedsofpracticalapplication.Inthisthesis,wedonotpaymoreattentiontoimprovetheaccu-racyofdependencyparsing.W

8、eproposeanovelnaturallanguageprocessingtask:The

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。