大数据视角下的腾讯微博用户的行为分析

大数据视角下的腾讯微博用户的行为分析

ID:34019088

大小:6.14 MB

页数:31页

时间:2019-03-03

大数据视角下的腾讯微博用户的行为分析_第1页
大数据视角下的腾讯微博用户的行为分析_第2页
大数据视角下的腾讯微博用户的行为分析_第3页
大数据视角下的腾讯微博用户的行为分析_第4页
大数据视角下的腾讯微博用户的行为分析_第5页
资源描述:

《大数据视角下的腾讯微博用户的行为分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据第1章绪论1.1引言互联网赋予了公民权利,大大提升了经济效率,带来了不计其数的创新爆发。数以亿计的人们正在使用互联网购物,便捷轻松地与人沟通,分享观点。llJ伴随着移动设备的普及和通信技术与网络的发展,社交网络最近几年取得了惊人的成就,电子商务和移动互联网产生了数量巨大的用户生成内容(UGC)。今天很难以估量以电子方式存储的数据到底有多少。纽约证券交易所每天产生1TB的交易数据;著名的社交网络Facebook上存储着约100亿张照片,约1PBl存储容量;Ancestry.com,一个家谱网站,存储着约2.5PB数据;瑞士日内瓦附近的大型强子对

2、撞机每年产生约15PB的数据。12J大量数据导致对存储设备容量的需求急剧增加,同时也带来了数据处理问题,并加速了新技术的诞生。本文借鉴以往社交网络及其分析的相关研究成果,从大数据的视角,用不同的方法来对社交网络的数据进行研究,从中挖掘社交网络用户共同的行为规律。从用户之间的关系层面转向所有用户共同的行为。在对社交网络及其分析进行理论研究基础上,形成对整个研究领域的宏观认识,对研究问题进行比较精确的定位。学习并借鉴前人的成果,结合腾讯微搏开放平台提供的开放API接口对已有的网络爬虫加以改进,使用改进后的网络爬虫获取研究数据。在获得数量可观的数据之后,利

3、用数据分析软件KNIME对用户数据进行分析,验证腾讯微博用户之间是否存在共同的行为规律。首先简要介绍数据来源及获取方法、获取内容等,并在数据初步处理的基础上对数据进行整体分析。包括腾讯微博的在一月、一周时间段的发表时间分布,和在一天内的发表时间分布。研究发现,腾讯微博的用户微博使用工作日要比周末频繁;而从一天时间切面来看,多数微博都发表在上午九点和晚上十点前后。其次对腾讯微博用户按照微博发布时间规律的不同进行聚类,并分析了不同种类人群的各自特征。通过聚类分析,将所有用户分为多个不同群组,分别研究每个不同群组的特征,发现他们各自的特点,并选取了较为典型

4、的几个群组作为代表。研究表明,腾讯微博用户微博使用确实存在不同的习惯群体,且可能与人们的日常生活存在一定的相关性。万方数据第l章绪论1.2社交网络分析源起斯坦利·沃瑟曼(StanleyWasserman)和凯瑟琳·福斯特(KatherineFaust)[31在《社会网络分析:方法与应用》中指出:社会网络分析的概念是从社会理论和应用与形式数学、统计学和计算方法论有机结合而来的。社会网络分析的先驱来自社会学、社会心理学和人类学领域。社会网络由一个或多个行动者有限集和他们之间的一种或多种关系组成。社会网络分析涉及理解社会实体间的联系和这些联系代表的意义;其

5、中的社会实体被称为行动者。社会群体成员间某种类型的联系的集合称为关系。联系特指行动者之间的社会联系。近几十年来,社会网络的概念和社会网络分析方法吸引了来自社会和行为科学界相当多的兴趣和关注。这些兴趣大多数可以归因于一个引人入胜的焦点:即对于社会实体之间的关系以及对这些关系的模式和含意的社会网络分析。许多研究人员已经认识到,通过给予政治、经济或社会结构环境的各个方面精确的形式化定义,这种网络观点能够以新的方式来解答标准的社会和行为科学研究问题。从社会网络分析的观点来看,社会环境可以表述为互相作用的个体之间的关系模式或规律性。过去几十年,社会网络方法已经

6、发展成为社会理论、经验研究、形式数学与统计学发展的必要组成部分。社会网络分析的许多关键的结构方法和观念的产生都得益于研究人员寻求描述经验现象的敏锐的洞察力,以及受社会理论的重要观念的启迪。除此之外,已经形成了用来检验在具体研究和模型检验过程中出现的网络结构属性的特定假设的方法。理论和方法之间的共生关系为网络分析技术的应用和理论打下了坚实基础。社会网络分析是建立在互相作用的个体间关系的重要性假设上的。社会网络视角包括以关系的概念或过程表达的理论、模型和应用,即由个体间的关联所界定的关系是网络理论的基本成分。在社会网络分析中,行动者和他们的行动被视为是相

7、互依赖的,而不是相互独立的自治的个体;行动者之间的联系(关联)是资源转移或“流动”的通道;个体的网络模型将网络结构环境视为个体行动的机遇或限制;网络模型将(社会、经济、政治等)结构概念化为行动者之间关系的稳定形式。网络分析以许多方式参与模型的发展、规范和测试的进程。通过形式化的定义、测试和描述来从关系的角度表达已有的理论概念,评估主要概念和命题被表述成关系过程或结构结果的模型和理论,或者提供对多重关系系统的统计学分析。在模型和理论的评估与检验方面,网络可以用来检验关于关系过程或结构的理论。这些理论假定了某种结构结果的存在,而这些结果随后可以用观测到的

8、网络数据加以评估。万方数据第1章绪论社会网络理论或命题的关键性在于它们需要那些社会单位通过各种关系关联在一起

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。