探析基于主题的中文事件抽取技术研究及应用

探析基于主题的中文事件抽取技术研究及应用

ID:34791197

大小:3.35 MB

页数:83页

时间:2019-03-10

探析基于主题的中文事件抽取技术研究及应用_第1页
探析基于主题的中文事件抽取技术研究及应用_第2页
探析基于主题的中文事件抽取技术研究及应用_第3页
探析基于主题的中文事件抽取技术研究及应用_第4页
探析基于主题的中文事件抽取技术研究及应用_第5页
资源描述:

《探析基于主题的中文事件抽取技术研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、苏州大学硕士学位论文基于主题的中文事件抽取技术研究及应用姓名:吴刚申请学位级别:硕士专业:计算机应用技术指导教师:钱培德20090501基于主题的中文事件抽取技术研究及应用中文摘要随着社会的发展,人们被包围在信息的汪洋大海之中。准确有效的从大量无序、杂乱、无结构的信息中提取感兴趣的事件信息,这正是事件抽取要解决的问题。现有的事件抽取的研究还主要局限在句子范围,然而,一个主题事件通常由多个状态和动作组成,其描述信息通常分散在一个或多个文档中,现有的事件抽取方法显然无法满足主题事件抽取的需要。本文在研究上述问题时,提出了将主题事件的抽取戈0分为三个层

2、次,并将其应用到访问主题事件的抽取中。第一,句子范围的元事件抽取,主要抽取一些相关的动作和状态。第二,篇章范围内的事件信息抽取,根据主题事件的框架结构,在句子范围的元事件抽取的基础上,通过篇章范围的语义信息将这些元事件进行串联,形成主题事件片段。第三,跨篇章的事件信息归并,首先本文使用聚类的方法确定事件归并的范围;其次按照一定的归并条件,将满足条件的主题事件片段进行归并。通过这三个层次的信息抽取和归并,就可以得到一个主题事件的完整信息描述。本文首先介绍了事件抽取的基本概念,研究现状和当前面临的主要困难。其次提出了一种定义在论元结构层次的事件抽取模

3、式,并提出了一种机器学习方法来获取事件抽取规则;该方法的特点是将语义角色标注技术应用于事件抽取,通过将触发动词支配的语义角色与待抽取的事件元素相对应,实现了句子范围内面向动词的事件信息的抽取。接着,本文介绍了一种基于元事件的事件知识表示框架,将主题事件看作是元事件的集合;抽取出框架中定义的元事件后,对其中的人物、地点、时间进行规格化处理,再利用指代关系、时间、地点这些重要的语义载体,在篇章范围内进行了初步的信息串联,从而获取了主题事件片段信息。然后,本文提出一种基于摘要的聚类方法将语料集合按照主题进行聚类,以此来确定跨篇章事件信息归并的范围。最后

4、提出了一种简单的归并条件,用于对分散在不同文档的主题片段信息进行归并。对访问主题事件的抽取实验结果表明,本文提出的基于元事件的框架定义对事件知识的表达是有效的,指代关系、时间、地点等语义载体的规格化处理,有效的进行中文摘要基于主题的中文事件抽取技术研究及应用了篇章范围内事件信息的串联,排除了干扰信息。在主题事件聚类实验中,本文提出的基于摘要的主题事件聚类方法和相似度计算方法的改进,相比常规的聚类方法,其效果得到了明显提升。关键词:事件抽取,信息抽取,事件聚类,语义角色标注,自然语言处理II作者:吴刚指导老师:钱培德ResearchandAppli

5、cationonChineseTopicEventExtractionAbstractandApplicationonChineseTopicEventExtractionAbstractWiththerapiddevelopmentofsociety,proplearesurroundedbytheinformationocean.Extractingeventinformationaccuratelyandeffectivelyfromalargeamountofdisorderly,messy,unstructureddataisthego

6、alofeventextraction.Currently,mostresearchesextracteventinformation(stateoraction)insentencescope.However,theinformationofatopiceventiscomprisedofseveralstatesandactions,anddistributedinmultipledocuments.CurrenteventextractionmethodinthescopeofsentenceCannotmeettherequisition

7、oftopicevent.Thispaperdividesthetopiceventextractionintothreescopes.Firstly,itextractsmeta-event(stateoraction)insentencescope.Secondly,itextractstopiceventsegmentinformationineverydocumentaccordingtoco—referenceandtheframeoftopicevent,Atlast,itCangetacompletedescriptionoftop

8、icevent,bycombiningthetopiceventsegmentsfromseveraldocuments.Thispap

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。