基于半监督学习的隐式篇章关系识别与研究

基于半监督学习的隐式篇章关系识别与研究

ID:34114624

大小:2.58 MB

页数:64页

时间:2019-03-03

基于半监督学习的隐式篇章关系识别与研究_第1页
基于半监督学习的隐式篇章关系识别与研究_第2页
基于半监督学习的隐式篇章关系识别与研究_第3页
基于半监督学习的隐式篇章关系识别与研究_第4页
基于半监督学习的隐式篇章关系识别与研究_第5页
资源描述:

《基于半监督学习的隐式篇章关系识别与研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、厦门大学学位论文原创性声明本人呈交的学位论文是本人在导师指导下,独立完成的研究成果。本人在论文写作中参考其他个人或集体已经发表的研究成果,均在文中以适当方式明确标明,并符合法律规范和《厦门大学研究生学术活动规范(试行)》。另外,该学位论文为()课题(组)的研究成果,获得()课题(组)经费或实验室的资助,在()实验室完成。(请在以上括号内填写课题或课题组负责人或实验室名称,未有此项声明内容的,可以不作特别声明。)声明人(签名):支砌2z/e.年5月仔日IIIIIIIIIIIIIIIIIIIU厦门大学学位论文著作权使用声明Y2536749本人同意厦门大学根据《中华人民共和

2、国学位条例暂行实施办法》等规定保留和使用此学位论文,并向主管部门或其指定机构送交学位论文(包括纸质版和电子版),允许学位论文进入厦门大学图书馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。本学位论文属于:()1.经厦门大学保密委员会审查核定的保密学位论文,于年月日解密,解密后适用上述授权。()2.不保密,适用上述授权。(请在以上相应括号内打“√”或填上相应内容。保密学位论文应是已经厦门大学保密委员会审定过的学位论文,未经厦门大学保密委员会审

3、定的学位论文均为公开学位论文。此声明栏不填写的,默认为公开学位论文,均适用上述授权。)声明人(签名):刘初诊f瞄手玉目f蓄日摘要篇章关系自动识别是自然语言处理领域一项非常具有挑战性的任务,该任务通过挖掘自然语言文本之间的结构信息、语义信息和词信息等来识别文本单元之间的逻辑关系,对自动问答系统、机器自动文摘、文本蕴含等都具有十分重要的实践和指导意义。根据文本单元中是否存在连接词可将篇章关系分为显式篇章关系和隐式篇章关系两种。显式篇章关系仅仅根据连接词就可以轻易分辨出文本之间的关系,而隐式篇章关系由于连接词的缺失使得其自动识别成为一个难点。目前,隐式篇章关系识别主要采用有

4、监督机器学习的方法,对候选关系实例的表示也处于探索阶段。然而有监督学习需要大量的人工标注数据来增强模型的可靠性和健壮性,考虑到人工标注数据难度大、代价高的困境,本文首次提出基于自训练和互训练的半监督策略来识别隐式篇章关系,并对候选关系实例的表示进行了进一步探索。本文研究内容主要包括三部分:(1)用ThePennDiscourseTreebank(PDTB)2.0作为研究载体,提取First—Last.First3、InquirerTags、产生式规则、依赖式规则、词的极性,动词特征、情态动词、实体特征、一元词对特征共9种特征以及特征之间的组合来表示候选关系实例。(2)

5、用有监督的方法对隐式篇章关系进行分类,实验结果表明,结构信息和语义信息相结合能取得比单一特征更好的效果。我们的结果比baseline提高了一到两个百分点。(3)根据有监督的实验结果,选取效果最好的组合特征构建基于自训练和互训练的半监督模型,利用少量标注数据和大量的无标注数据来识别隐式篇章关系,并对不同大小的标注数据集下的有监督模型、自训练模型、互训练模型的实验结果进行对比。结论表明,少量标注数据的情况F,半监督策略能取得更好的效果。关键词:隐式篇章关系识别;半监督;PDTBAbstractIntheareaofNatureLanguageProcessing(NLP)

6、,itisadifficulttaskfordiscourserelationidentification.Itaimstoidentifyandlabeltherelationsthatholdbetweenarbitraryspansoftext(clauses,sentences,orparagraphs).Thistaskiscrucialforunderstandingagiventext,especiallyhelpfulfornumerousnaturallanguageprocessingapplications,e.g.,textsummarizat

7、ion,questionansweringandtextualentailment.Generally,discourserelationsmarkedbyexplicitconnectivesintextaredefinedasexplicitdiscourserelations,otherwisewhensuchconnectivesareabsenttheyaredefinedasimplicitdiscourserelations.Thepresenceofdiscourseconnectivesbetweentextualunitscang

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。