融合句义特征的人名消歧及人物关系抽取技术研究.pdf

融合句义特征的人名消歧及人物关系抽取技术研究.pdf

ID:50452698

大小:2.67 MB

页数:73页

时间:2020-03-06

融合句义特征的人名消歧及人物关系抽取技术研究.pdf_第1页
融合句义特征的人名消歧及人物关系抽取技术研究.pdf_第2页
融合句义特征的人名消歧及人物关系抽取技术研究.pdf_第3页
融合句义特征的人名消歧及人物关系抽取技术研究.pdf_第4页
融合句义特征的人名消歧及人物关系抽取技术研究.pdf_第5页
资源描述:

《融合句义特征的人名消歧及人物关系抽取技术研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、融合句义特征的人名消歧及人物关系抽取技术研究张晗2015年1月中图分类号:TP391UDC分类号:500融合句义特征的人名消歧及人物关系抽取技术研究作者姓名张晗学院名称信息与电子学院指导教师石秀民、罗森林教授答辩委员会主席牛少彰教授申请学位级别工学硕士学科专业信息与通信工程学位授予单位北京理工大学论文答辩日期2015年1月22日TheResearchonPersonalNameDisambiguationandCharacterRelationshipExtractionMergingSententialSemanticFeatureCandidateName:

2、HanZhangSchoolorDepartment:SchoolofInformationandElectronicsFacultyMentor:XiuminShi,Prof.SenlinLuoChair,ThesisCommittee:Prof.ShaozhangNiuDegreeApplied:MasterofEngineeringMajor:InformationandCommunicationEngineeringDegreeby:BeijingInstituteofTechnologyTheDateofDefence:January,2015研究成果

3、声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:摘要人名歧义是一种身份不确定的现象,指的是文本中相同的人名指向现实世界中的不同实体人物。人名消歧具有很大的实际应用价值,是搜索引擎、社交网络和人名知识库构建等领域的基础性研究,在个性化搜索、自动问答、多文本摘

4、要、热点人物跟踪与发现等领域都有着广泛的应用。通过人名消歧获得了感兴趣人物的相关文本后,人们往往还关心与其具有特定关系的人物,仅仅识别出文本中的人物往往无法满足实际应用需求,这些人物之间存在着何种关系更为关键。因为文本中的人物关系是分散的,所以更需要从文本中快速准确地自动抽取人物关系。跨文本人名消歧是区分多文本中同名的不同人物实体的过程,是人名检索技术的重要组成部分,近年来成为自然语言处理中的一个重点问题。本文针对文本分析不够深入、表示不够精细造成的信息丢失和噪声干扰的问题,提出了一种融合句义特征的三阶段人名消歧方法。该方法首先针对查询词常作为普通词出现的特点,

5、在文本预处理后采用启发式规则的后处理方法判断其是否是人名;然后根据特征模板提取局部名实体特征及职业,通过句义结构模型进行句义分析,提取句义特征,引入重叠系数计算句义特征相似度,利用词袋模型统计词频,构成三层特征空间;最后使用基于规则的分类和两阶段层次聚类算法实现人名消歧。在CLP2012中文人名消歧语料上进行实验,结果表明该方法的F值达到88.79%,跨文本人名消歧方法中引入句义特征可进一步提升其处理效果。人物关系常常不以结构化的形式表达,人们对自动高效的人物关系抽取方法的需求是迫切的,本文针对三元组特征分析不够深入,种子词需要人工设定等问题,在抽取并分析关系特

6、征词所承担的句义任务的基础上,提出了一种自动的人物关系抽取方法。该方法首先利用统计词频特征及Bootstrapping算法,分别在少量有标记的语料和大量无标记的语料中训练得到关系特征词典;然后通过元素距离最优化规则构造语句的三元组实例,融合词法层及句义特征构造三元组特征空间;最后对三元组进行是非二元判定,利用置信度最大化原则得到人物关系类别。在BFS热门人物检索语料上进行实验,结果表明该方法的F值达到83.8%,实验效果良好。关键词:人名消歧人物关系抽取句义特征自然语言处理IAbstractNameambiguityisakindofidentityofunce

7、rtainphenomenon,referringtothetextofthesamenametodifferententitiesintherealworld.Namedisambiguationhasgreatpracticalapplicationvalue,whichmakesgreatinfluenceinthesearchengine,socialnetworkandknowledgebasebuildingnamesforbasicresearch.Inthepersonalizedsearch,automaticquestionanswering

8、,multi-docum

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。