利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf

利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf

ID:52741019

大小:3.62 MB

页数:43页

时间:2020-03-30

利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf_第1页
利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf_第2页
利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf_第3页
利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf_第4页
利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf_第5页
资源描述:

《利用大数据舆情分析和文本挖掘来分析《大秦帝国之崛起》.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、利用大数据舆情分析和文本挖掘来看《大秦帝国之崛起》在进行全网舆情分析的时候,首先普及一下概念,什么是舆情和网络舆情。舆情顾名思义指的就是针对于社会生活中各个方面的问题尤其是针对于热点问题的公开意见或者情绪问题。而网络舆情,从字面上的理解就是通过互联网渠道来反映社会态度和观念等。详细了解大数据舆情分析可以在一定程度上辅助我们决策,提高工作效率。而我们本文将以《大秦帝国之崛起》作为分析对象,来详细阐述在大数据时代数据分析会涉及到的全网舆情分析、微博传播分析以及文本挖掘。今年开年,因饰演白起的演员王学兵吸毒而拖延上映的《

2、大秦帝国之崛起》(以下简称为“崛起”),终于在剧迷的千呼万唤中播出。这部根据孙皓晖同名小说改编的电视剧是“大秦帝国”系列的第三部,首部《大秦帝国之裂变》,第二部《大秦帝国之纵横》分别于2009年、2013年播出,均获得不错的口碑,第三部《大秦帝国之崛起》因为上面的原因而补拍,直到今年年初才在央视开播。本文将以该剧作为分析对象,来详细阐述在大数据时代数据分析会涉及到的三个“子课题”:全网的舆情分析:基于全网媒体或网民关于该剧的探讨,进行“SocialListening(社会化聆听)”,了解该剧整体口碑概况微博传播分析

3、:基于新浪微博某条对于该剧具有重大影响力的微博的传播情况,了解该条微博的传播规律,互动粉丝的画像,以及水军的辨识文本挖掘:通过对该剧相关非结构化文本数据的分析,了解其获得观众较高认可的原因在接下来的分析中,笔者将结合分析工具(新浪舆情通、头条媒体实验室、Python、Gephi等)、分析思路(分析角度和分析流程)、业务知识(对该剧的了解和原著小说的认知),来谈谈一个完整的数据分析case如何完成,上面所涉及的3个子课题是本文分析的重点。下图是本文的主要内容和文章结构:1“崛起”的全网舆情分析1.1全网关注情况(1)

4、“崛起”的全网关注度走势因为该剧播出的时间段是2017-2-9~2017-3-6,故笔者选取了在该剧播出前后略有延展的时间区间,以便观察这段时间内关于该剧的全网信息量走势。大秦帝国之崛起全网关注度走势图(2-1~3-13)从全网总体的关注度来看,在电视剧播出前的关注量较少,而在电视剧播出期间的关注度(有关该剧的网络信息量)陡然上升,在播出的第一天(2017-2-9)关注度就出现了明显在上升。在该剧在播出结束后(2017-3-6),信息量逐渐减少,呈下降趋势。(2)“崛起”的全网关注度来源从各信息发布渠道的表现来看,

5、该剧在微博(新浪微博和腾讯微博)上的信息量占据主导地位,“二次崛起”后的微博仍是娱乐影视的主阵地,是粉丝与主创团队进行互动的首选。下图是“崛起”的全网信息量来源构成。除去微博的信息之后,则可以看到除微博(新浪微博和腾讯微博)以外哪些信息渠道关于该剧的讨论量较多。由此可以看出,新浪博客、百度贴吧这样的泛娱乐化社区关于该剧的讨论也颇多,前者滥觞于明星入驻,是全国最主流,人气颇高的博客频道之一;而百度贴吧是全球最大的中文社区,是“粉丝文化”的催化剂。百度贴吧的迅速走红,是与“粉丝”及“粉丝文化”的流行紧密相关的,而在“粉

6、丝文化”的发展过程中,百度贴吧也起到了重要作用。1.2全网关于“崛起”的关注点(1)“崛起”的全网信息形成的关键词云以下是全网关于“崛起”的文本信息的关键词提取,总计有60个,这些关键词来自于媒体报道,抑或用户UGC评论,从中我们可以发现网路上关于该剧的讨论集中在哪些关键点上。从上图中可以看出,除了本剧的片名—“大秦帝国”以外,还有一些比较反映该剧特征的词汇,根据笔者对该剧的了解,特挑出其中主要的两类词汇:剧集相关:“收视”和“收视率”(在无大规模宣传的情况下,收视率一路走高)、“拍戏”、“张博”(饰演秦昭襄王嬴

7、稷的演员)、“导演”、“剧本”、“创作”、“花絮”、“创作者”该剧的意义:“文化”、“历史”、“陕西”、“国家”、“文明”、“秦国”、“正剧”、“大秦”,(这类词汇能在一定程度上代表该剧想要表达的价值观—居今之世,志古之道,所以自镜,拒绝戏说,尊史重实)(2)与“崛起”相关的关联词分析全网事件的热度信息关联词分析,它是通过系统自动运算找出事件核心词、并计算出与核心词同时出现关联度最高的高频词,也就是与核心词共现频率最高的词汇(关于“共现”的原理介绍,请看《如何用数据分析,搞定新媒体运营的定位和内容初始化?》的第三

8、部分)。假若读者看过该剧,从上面的关联词即可看出,该剧的“正剧”属性确凿无疑,是一部独具匠心的佳剧!(3)与“崛起”相关的热门文章这里的关于“热门”文章的定义主要是通过三个维度综合得出,即阅读量、转发量和评论量的综合评价。上面有7篇个热门文章,它们在全网信息中的综合得分(阅读量、转发量和评论量)最高。从这几篇文章的标题可以看出,它们主要以预告即将播出的剧集的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。