事件类型识别问题研究

事件类型识别问题研究

ID:76348412

大小:5.81 MB

页数:55页

时间:2022-01-15

事件类型识别问题研究_第1页
事件类型识别问题研究_第2页
事件类型识别问题研究_第3页
事件类型识别问题研究_第4页
事件类型识别问题研究_第5页
事件类型识别问题研究_第6页
事件类型识别问题研究_第7页
事件类型识别问题研究_第8页
事件类型识别问题研究_第9页
事件类型识别问题研究_第10页
资源描述:

《事件类型识别问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:单位代码:密级:学号:硕士学位论文论文题目:事件类型识别问题研究王一哲计算机科学与技术学院专业名称计算机软件与理论指导教师王新军教授合作导师年月日分类号:单位代码:密级:学号:硕学位论文论文题目:事件类型识别问题研究作者姓名王一哲院名称计算机科学与技术学院专业名称计算机软件与理论指导教师王新军教授合作导师年月日原创性声明本人郑重声明:所呈交的学位论文,是木人在导师的指导,独立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究作

2、出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:王日期:关于学位论文使用授权的声明本人同意学校保留或向国家有关部门或机构送交论文的印刷件和电子版,允许论文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分内容编入冇关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇编本学位论文。保密论文在解密后应遵守此规定)论文作者签名:王■名口期:山东人学硕士学位论文目录摘要第一章绪论研究背景及意义事件类型识别面临的问题研究内容论文贡献论文组织结构第二章事

3、件类型识别研究现状弓事件类型识别发展过程事件类型识别研究现状基于领域事件词聚类的典型事件类型识别基于模式匹配的识别方法基于扩展触发词表的事件类别识别基于机器学习的事件类别识别事件类型识别的未来发展趋势本章小结第三章基于分割技术的文本块划分引言问题定义文本块划分方法文本块划分框架语段结构分析语句间相似度计算特征有效度分析语句间相关性计算及文本块划分山东人学硕丨:学位论文实验评估数据集评估标准实验结果与分析本章小结第四章事件类型识别中的语句过滤问题引言相关定义框架概述文本中语句过滤方法非屯件语句过滤虚假珙件

4、语句过滤丈验实验数据实验结果与分析本小结第五章总结与展望她展望参考文献该山东人学硕学位论文…山东人学硕丨位论文山东大学硕士学位论文摘要随着信息技术的飞快发展,网络逐步成为一个巨大的数据源,其中包含了众多有价值的信息。这些信息很多是关于已经或正在发生的各类事件的,例如普遍存在于各大网站上的国家政府要人的活动,公司的新闻动态等等。事件抽取作为从各式文本中自动获取所需信息的一种手段,一般包括实体及对其关系的抽取。它主要分为两个步骤:(事件类型识别,确定事件的类别以及子类别;(事件元素识别,标注出当前类别的事件

5、所包含的实体参与者及其角色。本文致力于事件类型识别技术研究,目标是在保障识别结果准确率的前提下,能够面向更大规模、更高复杂度的数据,能够充分挖掘文本中有价值信息,最终丰富事件抽取的内容。而当前事件类型识别系统所识别的范围并不符合事件抽取的实际需求,视角要么基于语句层级,要么基于篇章层级,存在过大或过小的问题;另一方面,由于多数抽取系统都聚焦于事件元素和事件触发词,对事件相关性识别基于文本全部词语的判定;待识别语句的高冗余度性也给机器带来了严重负担,其引入的众多反例也使得正反例极度失衡。本文针对现有事件类

6、型识别范围不够精准,待识别语句冗余度高,类型识别可靠性差等问题展开研究,主要工作和贡献概括如下:提出一种基于分割技术的文本块划分方法,能够把待抽取的文本范围规范至语句和篇章之间的文本块大小,使得每个文本块中包含若干同话题的事件,为下一步的语句过滤做好基础。提出一种语句过滤方法,基于划分好的文本块对非事件、虚假事件语句进行过滤,同时甄别语句包含的事件事实信息的真假性。此方法能够有效解决传统事件类型识别中正反例失衡的问题,实现较高的分准率,增强了事件类型识别的适应能力。关键词:事件抽取;机器学习;事件类型识

7、别;文本块;候选事件实例山东人孚她,位论文、,,山东人学硕丨:学位论文,,:山东大学硕学位论文第一章绪论研究背景及意义当今社会,人和机器时时刻刻都被巨量信息包围。大数据的应用既是信息时代飞跃的象征,也给信息研究和数据处理等各方面带来了严峻的挑战。作为知识表示和信息识别的单元,事件逐步被研究人员重视,这包括对事件的内部结构(时间、地点等要素)和外部关系(上下文、时间等语义关系)的研究。事件抽取技术文本中特定领域或类别的事件进行分析识别,将事件中的各个实体及其相互关系抽取出来,形成结构化的信息存储在数据库中

8、。因此,在对事件文本进行信息抽取前,首先需要进行事件类型识别,对文本中的事件进行准确定位与分类。准确的事件类型识别可为后续的抽取研究打好坚实基础,具有重要应用价值。而在实际生活中,事件类型识别丨】更是涉及到多个方面,事件类型的复杂性也决定了类型识别整个过程的复杂性。在事件类型识别中,对类别进行有效划分,确定类型及其元素,才能够让机器按照人的指导来识别事件及元素。事件的每一个类别或子类也都有其自己参与者的角色。但是,当前事件类型识别的研究并没

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。