基于云计算的网络舆情热点发现研究

基于云计算的网络舆情热点发现研究

ID:35059961

大小:4.10 MB

页数:93页

时间:2019-03-17

基于云计算的网络舆情热点发现研究_第1页
基于云计算的网络舆情热点发现研究_第2页
基于云计算的网络舆情热点发现研究_第3页
基于云计算的网络舆情热点发现研究_第4页
基于云计算的网络舆情热点发现研究_第5页
资源描述:

《基于云计算的网络舆情热点发现研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:学校代码:10128UDC:学号:20131100081硕士学位论文学生类别:全日制学术型硕士研究生学科名称:计算机应用技术论文题目:基于云计算的网络舆情热点发现研究英文题目:ResearchofHotTopicsDetectioninInternetPublicOpinionBasedonCloudComputing学生姓名:王宇指导教师:刘利民教授许志伟讲师二○一六年六月原创性声明工作及取得的本人声明:所呈交的学枯谣文是本人在导师的指导下进行的研究研巧成果。除文中已经注巧引用

2、的内容外,论文中不包含其他人己经发衷或撰写过的研巧成果■柏不向舍为强得内巧古工业大学及其他教育机构的学位或证书而使,巧过的材料一。与我同工作的同志对本研巧所做的任何贡献均己在论文中作了明确的枕明并表示谢意。备气:^学位论文作者藉名:指导教师盤名%。I诊;《日期;於听钟日期学位论女版权使用授权书本学垃论文作者完全了解学校有关保留、使用学位论文的规定,即:内讓古工业大学有权将学位论文的全部或部分内容保留并向国家有关机构、部口送交学位论文的、复印件和磁盘,也

3、可缩印或其它复制手,允许缩入有关敷据库进行检索W采用影印段保存、汇骗学位论文。为保护学校和导师的知识产权,作者毕业后涉及谅学位论文的主要内容或研充成果用于发表学术论文须征得内蒙古工业大学就读蝴间导师的同意。,井且版权单位必须署名为内蒙古工业大学方可投稿或公开发表本学位论文属于。保密□,在_年觸密盾适用本授权书‘‘小不保巧母)1(请在上方框内打相1;如学位论文作者签名:指导教师签名豕如似日期:作占句曰親r内蒙古工业大学硕士学位论文摘要随着互联网的快速

4、发展,互联网传播成为主要的社会信息传播方式,当社会上出现了突发的敏感事件时,公众舆论会迅速集聚在网络上,网络舆情事件也就随之形成。由于网络舆情具有内容丰富、信息量大、相关话题繁多等特点,这也让网络上更容易出现传统意义上的低俗、露骨、色情、暴力,甚至是危害国家和谐、稳定和安全的信息与言论,网络舆情热点发现可以帮助决策者快速准确的对网民聚焦的话题进行关注。网络舆情热点发现整个过程就是一个文本挖掘过程,但传统的文本挖掘过程难以适应网络舆情所具备的上述特性,故解决挖掘算法在效率、适应性和可用性等方面的瓶

5、颈问题变得日益重要。基于上述背景,本文参考借鉴近年来文本挖掘领域的相关理论与技术的最新研究成果,对传统的文本挖掘模型进行了分析研究,并进行了包括数据采集、中文分词、特征提取、特征项权重计算、文本特征向量空间表示模型的建立、相似度分析、聚类算法和热度分析的实现。针对传统文本表示模型建立过程中存在的特征项过多的问题,结合网络舆情数据具备的短文本特性,给出了基于语义特征项频率的舆情短文本表示模型降维方法,以降低文本表示模型的维度;在聚类算法中选取了经典的增量聚类算法Single-Pass,针对该算法存

6、在的不足,给出了改进Single-Pass聚类算法,以解决聚类过程中算法对输入数据顺序的敏感性和求解效率的问题,并提出了网络舆情热度分析模型;在上述工作基础上,对数据预处理部分和聚类分析部分进行了基于MapReduce的并行化处理和实验验证,并利用图表对求解效率和求解质量进行了分析。本课题所研究的基于云计算的网络舆情热点发现方法,在一定程度上解决了传统的文本挖掘模型在处理海量中文文本数据时能力不足的问题。本课题方案成本较低,易于扩展,可以作为一种有效的网络舆情监控手段,并应用在实际工作中。关键词

7、:网络舆情;云计算;热点发现;增量聚类;降维I内蒙古工业大学硕士学位论文AbstractWiththerapiddevelopmentofInternet,Internetcommunicationhasbecomeamajorwayforspreadingsocialinformation.Wheneverthereisanysuddensensitiveissue,publicopinionswouldbesoongatheredonInternet,whichthereforeformin

8、gthepublicopinionevent.However,Internetpublicopinionsinvolverichtopics,greatamountofinformationandcomplexsubjects,whichmakingiteasiertocreateinformationandcommentswhichare,inatraditionalmeaning,vulgar,barefaced,pornographicorviolent,andwouldeventhrea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。