基于主题模型的主题演化分析及预测

基于主题模型的主题演化分析及预测

ID:35059705

大小:3.02 MB

页数:56页

时间:2019-03-17

基于主题模型的主题演化分析及预测_第1页
基于主题模型的主题演化分析及预测_第2页
基于主题模型的主题演化分析及预测_第3页
基于主题模型的主题演化分析及预测_第4页
基于主题模型的主题演化分析及预测_第5页
资源描述:

《基于主题模型的主题演化分析及预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、'V'巧::爲1懸名本:!;祭’";1、..:^'V'.I'.人1,;"I‘单位代码=10巧3密级:.i;t,II1"'.|辛'节!I.一。《兰著iii若!硕女#像俗A:;声;'’?;詞敲.,?遂',■-主:满:/-著I//:.’?.-.、-■、*<j.?、^二‘-VU知寺..--'、/vr-n?4;|‘'','jV、.论文题目:基于主题模型的韦题演化分析

2、及预测'.'.,VV■■.■-;’V,‘..:.u,V.i一■\*,'三?■;...''."■-■■,'i"■?^?■:1013041018.心学号;.—J茅利锋;;姓名—张伟教授导。巧息安全^学科专业信%计算机通信网与安全研究方向工学题±申请学位类别20164年—_j论文提交日期—.I:^-.-.一?*t.?南京邮电大学学位论文原创性

3、声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研巧成果。尽我所知,除了文中特别加W标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。一.与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。一本人学位论文及涉及相关资料若有不实,愿意承担切相关的法律责任。研巧生签名:《名接日期;-)。^斗1南京邮电大学学位论文使用授权声明本人授权南京邮电大学可W保留并向国家有关部口或机构

4、送交论文的复印件和电子文档可;允许论文被查阅和借阅;可W将学位论文的全部或部分内容编入有关数据库进行检索;论W采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质一文的内容相致。论文的公布(包括刊登)授权南京邮电大学研究生院办理。涉密学位论文在解密后适用本授权书。研究生签名:_导师签名:又日期:异片著為緣本StudyoftextevolutionanalysisandpredictionbasedontopicmodelThesisSubmittedtoNanjingUniver

5、sityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByMaoLifengSupervisor:Prof.ZhangWeiApril2016摘要随着互联网的不断发展,社交媒体得到了急速发展。如何利用用户在社交网络中产生的海量数据,来对其进行演化分析,成为了自然语言处理领域的研究热点。在社交媒体中,传统的主题检测方法其准确性和效率难以保证,为此主题模型的方法被提出。主题模型认为主题是由一组语义相关的词及词的概率分布表示,其具有可以很好的模拟大规模语料的语义信

6、息的特性,因而得到广泛的应用。本文在已有的主题获取与演化技术的基础上做出了以下有意义的创新。首先,提出了一种基于潜在狄利克雷分配模型的主题演化方法。该方法在已有的演化方法的基础上,增加了主题过滤的方法,并在主题内容演化方面提出了一种判断主题演化状态的方法;其次,在主题演化方法的基础上,结合马尔科夫链模型,提出了一种可以预测主题演化趋势的方法;最后,尝试使用层次狄利克雷过程方法来代替潜在狄利克雷分配模型,以实现主题演化过程中主题数目的自动确认。在NIPS论文集上的实验表明,本文提出的演化可以准确获得主题在内容和强度上的演化趋势,结合马

7、尔科夫链的预测方法可以有效预测其在未来几个时间窗口的演化趋势,使用层次狄利克雷的方法对主题演化进行分析及预测的效果优于使用潜在狄利克雷分配模型的方法。关键词:主题演化,主题模型,潜在狄利克雷分配模型,马尔科夫链,层次狄利克雷过程IVAbstractWiththedevelopmentoftheInternet,socialnetworkhasarapidimprovement.Evolutionaryanalysisofmassdatageneratedbytheusersinsocialnetworkhasbecomeahotsp

8、otinnaturallanguageprocessing.Insocialnetwork,traditionaltopicdetectionmethodisdifficulttoguaranteeitsaccuracyandeffi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。