基于深度学习的中文微博人物关系图谱的研究与实现

基于深度学习的中文微博人物关系图谱的研究与实现

ID:24950956

大小:1.28 MB

页数:63页

时间:2018-11-17

基于深度学习的中文微博人物关系图谱的研究与实现_第1页
基于深度学习的中文微博人物关系图谱的研究与实现_第2页
基于深度学习的中文微博人物关系图谱的研究与实现_第3页
基于深度学习的中文微博人物关系图谱的研究与实现_第4页
基于深度学习的中文微博人物关系图谱的研究与实现_第5页
资源描述:

《基于深度学习的中文微博人物关系图谱的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、武汉邮电科学研究院硕士学位论文基于深度学习的中文微博人物关系图谱的研究与实现ResearchandRealizationofCharacterRelationshipGraphinMicroblogsbasedonDeepLearning专业:通信与信息系统研究方向:大数据与云计算导师:王峥研究生:王超学号:20150037二〇一八年一月武汉邮电科学研究院硕士学位论文独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果,除了文中特别加以标注的地方外,没有任何剽窃、抄袭、造假等违反

2、学术道德、学术规范的行为,也没有侵犯任何其他人或组织的科研成果及专利。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。如有任何侵权行为,本人愿意为此独立承担全部责任。作者签名:_______________签字日期:关于论文使用授权的说明本人完全了解武汉邮电科学研究院(烽火科技集团)有关保留、使用学位论文的规定,本文知识产权归武汉邮电科学研究院所有,武汉邮电科学研究院有权保留送交论文的复印件和电子版本,允许论文被查阅和借阅。同意将本人的学位论文提交中国学术期刊(光盘版)电子杂

3、志社全文出版并收入《中国学位论文全文数据库》。公开保密一年保密两年(注:保密的学位论文在解密后遵守此协议)作者签名:签字日期:导师签名:签字日期:武汉邮电科学研究院硕士学位论文摘要过去十年来,基于特征的方法和基于核函数的方法一直是关系提取研究的两个主要方法,虽然这些方法能够很好的利用句子中离散的特征,但对于从未出现的词仍然无法很好的预测,因此使用词向量(wordsembedding)对词语进行连续表征的方法也逐渐成为关系提取的研究热点。近年来,卷积神经网络(CNN)以及循环神经网络(RNN)通过连续表征(c

4、ontinuousrepresention)为捕获句子中的隐藏结构提供了有效机制,从而提高了关系提取的性能。卷积神经网络的优点在于其能推导句子中的连续n元语法(n-garm),而循环神经网络能够有效的对长范围句子语境进行编码。本文通过结合传统的基于特征的方法,卷积神经网络,以及循环神经网络,提出了一种联合模型,提高关系抽取的性能。本文同时对不同网络架构和组合方法的系统性能评估证明了这种方法的有效性,并在ACE数据集和SemEval数据集上达到了较好的性能。本文主要工作包括:(1)阐述了卷积神经网络以及神经网

5、络的结构以及原理,同时对各种网络结构进行系统的探索,以得到适用于关系提取的RNN模型。(2)广泛的研究组合RNN和CNN的方法用于关系提取,从而得到适用于关系提取最佳的组合模型,为了结合更多的语言学特征,本文还将组合模型与传统的对数线性模型(log-linearmodel)进行结合得到了一种最优混合模型,ACE数据集和SemEval数据集上的实验结果表明该混合模型取得了较高的性能。(3)最后本文将该混合模型应用到新浪微博文本,实现了人物关系的提取以及可视化展示,实验表明本文的混合模型在非正式文本以及跨领域方

6、面也有很高的性能。关键词:人物关系提取;卷积神经网络;循环神经网络;微博I武汉邮电科学研究院硕士学位论文AbstractThetwomethodsdominatingREresearchinthelastdecadearethefeature-basedmethodandthekernel-basedmethod.Theseresearchextensivelystudiestheleverageoflinguisticanalysisandknowledgeresourcestoconstructthef

7、eaturerepresentations,involvingthecombinationofdiscretepropertiessuchaslexicon,syntax,gazetteers.Althoughtheseapproachesareabletoexploitthesymbolic(discrete)structureswithinrelationmentions,theyalsosufferfromthedifficultytogeneralizeovertheunseenwords,moti

8、vatingsomeveryrecentworkonemployingthecontinuousrepresentationsofwords(wordembeddings)todoRE.Recently,convolutionalandrecurrentneuralnetworkshasprovidedveryeffectivemechanismstocapturethehiddenstructureswithi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。