微博热点话题发现方法研究

微博热点话题发现方法研究

ID:34598467

大小:5.19 MB

页数:46页

时间:2019-03-08

微博热点话题发现方法研究_第1页
微博热点话题发现方法研究_第2页
微博热点话题发现方法研究_第3页
微博热点话题发现方法研究_第4页
微博热点话题发现方法研究_第5页
资源描述:

《微博热点话题发现方法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Abstract4.Realizingtheabovemethodsandstudyingonthealgorithm’Sperformance.Alargenumberofexperimentsshowourmethodcallfindhottopicsinlarge—scalemicro—blogtextaccuratelyandquickly,thismethodhasahigherpracticalvalue.Keywords:micro—blogmining,hottopic,textclustering,textsimilari

2、tyIII目录摘要⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..IAbstract⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.II第一章绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..11.1课题的背景和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.11.2国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21.3本文研究内容⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..31.4本文组织结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..4第二章微博热点话题发现方法概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯62.1微博简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯62.2微博特点分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

3、..72.2.1微博信息特点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯72.2.2微博信息的特有结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯92.3微博热点发现常用方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..102.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..12第三章文本相似性度量方法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..133.1文本特征提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.133.1.1文本预处理⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.143.1.2文本的特征选择与表示⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯153.1.3构建向量空间矩阵⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.163.2文本相似性计算⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

4、⋯⋯..173.3基于知网的语义相似度⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..173.3.1知网简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯183.3.2基于知网的词语语义相似度计算方法⋯⋯⋯⋯⋯⋯⋯193.3.3结合语义的中文文本相似度计算⋯⋯⋯⋯⋯⋯⋯⋯.193.4本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..20第四章微博热点话题发现算法设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..214.1算法总体框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.214.2有用信息提取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.234.3微博类别识别⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.234.4微博特征提取与表示⋯⋯

5、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.254.5微博文本聚类.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯274.5.1微博中的长尾现象⋯.⋯⋯.⋯⋯⋯⋯⋯.⋯⋯⋯.27l目录4.5.2文本聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..284.5.3微博聚类算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..304.6热点话题形成⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.324.7本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..33第五章实验与分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.345.1实验数据源⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯..345.2测试方法⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.355.3算法的时

6、间效率分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.395.4中文微博热点发现⋯⋯...⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯..395.5本章小结⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.41第六章总结与展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.426.1总结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯..426.2展望⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯..43参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.44致谢⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..48第一章绪论1.1课题的背景和意义微博,即微博客(MicroBlog)的简称⋯,是一个基于用户关系的信息分享、传播以及获取平

7、台,用户可以通过WEB、WAP以及各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。微博作为一个支持多平台的信息交流和具有充分互动性的多媒体博客,自从2006年诞生以来,就以爆炸式的增长在全球扩展,现在已成为普通用户共享个人信息,以及获取他人的实时信息的主要平台,也成为媒体的重要组成部分。同时,微博用户可以无须认证将能够关注他人,转发他人发布的信息。这在很大程度上增强了微博平台的开放性,使得微博平台信息量飞速增长,它也加强了微博信息的变化性,多样性和及时性。微博对于热点事件十分敏感,几乎事件发生的同时就能够在微博平台上引

8、发广泛的讨论。从而产生和事件相对应的一个话题。由于许多微博作者是事件的亲身经历者,这使得微博上经常能够出现独家的、第一手的热点事件材料。因此对微博上的热点话题进行关注具有很高的现

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。