基于大数据的社交网络数据挖掘-毕业论文.docx

基于大数据的社交网络数据挖掘-毕业论文.docx

ID:10469311

大小:1.32 MB

页数:64页

时间:2018-07-06

基于大数据的社交网络数据挖掘-毕业论文.docx_第1页
基于大数据的社交网络数据挖掘-毕业论文.docx_第2页
基于大数据的社交网络数据挖掘-毕业论文.docx_第3页
基于大数据的社交网络数据挖掘-毕业论文.docx_第4页
基于大数据的社交网络数据挖掘-毕业论文.docx_第5页
资源描述:

《基于大数据的社交网络数据挖掘-毕业论文.docx》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于大数据的社交网络数据挖掘第一章绪论硕士学位论文论文题目基于大数据的社交网络数据挖掘研究生姓名指导教师姓名专业名称计算机技术研究方向社交网络数据挖掘论文提交日期年月基于大数据的社交网络数据挖掘第一章绪论基于社交网络数据的大数据挖掘摘要万事万物都有联系,人们与社交网络相互联系,与信息,组织,所在地相互联系,只对个体进行研究所获得成果是有限的,所以要对整个系统进行研究,而这个系统就是一个社交网络。社交网络分析由图论,数学以及社会学中的社交网络理论发展而来,在最近的这10-15年中,网络分析还借助计算机科学,物理学,生物学和经济学等不同领域的发展。

2、相比传统网络应用形式,社交网络具有用户主体性强、网络特征多样、数据内容丰富、群体交互密切、信息传播迅速等特点。传统的研究方法与模型难以准确地描述社交网络中用户的行为特征,因而难以实现符合社交网络特性的数据挖掘与分析。针对现有算法与模型运用于社交网络时存在的效果与性能问题,分别从社交网络数据采集与处理、社交网络数据实证分析、用户影响力与行为分析,对社交网络中的数据挖掘方法进行了研究。本文先从斯坦福大学的StanfordLargeNetworkDatasetCollection中下载Amazonnetworks数据,探讨了从提取数据、整理数据、数据

3、预处理,探索性分析、算法选择、模型的建立和评估分析的全部过程。先用Python对数据预处理,导入数据库,并用Clementine12.0分析其中客户购买产品后评价的有效性,并对此评价是否对其他客户购买该产品产生影响,采用数据挖掘技术,可挖掘出数据之间存在的潜在信息。数据挖掘中的聚类分析可以将相似度较高的用户数据聚成一个类然后采用聚类算法对数据进行聚类。本文对客户评价的时间,评价的频次,评价的得分进行聚类分析,最后对分析过程中运用的两种聚类方法取得的结果进行分析比较,获取客户分级体系。通过得出的结果可对当前亚马逊的购买客户进行分级维护,对于最有价

4、值客户可给与客户相应的等级,将社交网络大数据与微营销结合起来,提升亚马逊的销售业绩和影响力,从单一的购物商城模式,发展微营销渠道,培育自己的粉丝。关键词:大数据、社交网络、数据挖掘、聚类作者:指导教师:基于大数据的社交网络数据挖掘第一章绪论目录第一章绪论11.1课题背景11.1.1大数据时代11.1.2社交网络21.2问题的提出31.3课题研究的意义31.4课题研究的内容和成果41.5本文的主要内容和组织结构5第二章数据挖掘技术及工具介绍62.1数据库62.2数据挖掘工具(介绍Clementine12.0)62.3Python82.4核心思想和

5、算法92.4.1聚类92.4.2RFM模型112.5数据预处理152.5.1数据准备152.5.2数据审计182.5.3数据清洗与加工18第三章聚类方法在客户评价中的作用213.1目的和意义213.2数据准备和预处理213.2.1数据准备213.2.2数据预处理223.3聚类分析233.3.1K-Means聚类说明233.3.2K-Means聚类过程243.3.3K-Means聚类结论353.3.4TwoSteps聚类363.3.5两种聚类方式结果讨论383.4相关建议39第四章RFM模型与客户细分414.1目的和意义414.2数据准备和预处理

6、414.2.1数据准备414.2.2数据RFM结构化424.3基于RFM模型的客户细分454.3.1K-means聚类464.3.2Two-step聚类524.3.3两种聚类方式结果讨论544.4相关建议55第五章总结与展望56基于大数据的社交网络数据挖掘第一章绪论5.1本文总结565.2工作展望56参考文献57攻读硕士学位期间发表(录用)的论文59致谢60基于大数据的社交网络数据挖掘第一章绪论60基于大数据的社交网络数据挖掘第一章绪论第一章绪论1.1课题背景1.1.1大数据时代什么是大数据(bigdata)?维基百科将其定义为大数据是指无法在

7、可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,困难存在于数据的获取、存储、搜索、共享、分析和可视化等方面。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。"IDC(互联网数据中心)数据显示,2015年全网数据达到8ZB(1Z=2的70次方),如图1所示,而且90%是非结构化的。而业界将大数据时代归纳为4个"V"--Volume,Variety,Value,Veloc

8、ity(体量巨大、多样性、价值密度低和秒处理)。由于各维度都在迅速膨胀,信息爆炸正影响着每一个企业、个人。在如此巨大的数据背后必然隐藏着海量的社会化营

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。