欢迎来到天天文库
浏览记录
ID:31433084
大小:113.50 KB
页数:9页
时间:2019-01-09
《linkedin 职业网络中的数据挖掘应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、LinkedIn职业网络中的数据挖掘应用 摘要:近年来,社交网络发展迅速,各种社交的网络平台每天都会产生海量的用户数据。这些无序的数据中隐藏着潜在的价值,也为研究者提供了用数据挖掘中的方法来分析这些数据的机会。聚类是数据挖掘中的一个基本技术,而利用聚类方法我们能够实现LinkedIn职业网络中的数据挖掘。 关键词:社交网络;数据挖掘;应用;聚类;LinkedIn职业网络 中图分类号:TP301文献标识码:A文章编号:1009-3044(2016)13-0001-02 Abstract:Inrecentyears,withtherapiddevelop
2、mentofsocialnetwork,thedifferentsocialnetworkingsitesproducelargeamountsofuserdataeveryday.Thereispotentialvalueinthesedisordereddata.Italsoprovidesresearcherswithopportunityofusingdataminingmethodstoanalyzethesedata.Clusteringisanessentialdataminingtechniques,andwecanachievedatami
3、ninginLinkedInprofessionalnetworkwiththeuseofclusteringmethod. Keywords:socialnetwork;datamining;application;clustering;linkedinprofessionalnetwork9 社交网络,顾名思义是用于社交的网络平台,它最初是以交友为开端的,在社会的不断发展中逐渐演变成了今天的集社交、通讯、娱乐、商业等元素为一体的多元化平台。基于网络的社会交往诞生于早期的基于终端的计算机,以及通过新闻组或其他早期的互联网软件来进行。社交网络的新时代开始
4、于互联网的性能的上升,以及万维网(Web)的逐渐占据主导地位。 近年来,国内的新浪微博、人人网,国外的Facebook、Twitter和LinkedIn等社交网站,也已经从时尚变为主流。而社交网络的爆发之所以能在最近几年爆发,很大程度上是由于社交网络和媒体共享网站提供了大量的用户数据。而如何对这些海量数据进行高效的分析和处理,也决定了社交网络今后的发展。 1社交网络数据分析概述 网络和信息技术的飞速发展使得社交网络成为人们生活中不可缺少的一部分。网络设计采用电子邮件作为一个起点,而不是实际生活中的信件。然后开心网,BBS等网站,是由它演变,并且以虚拟为
5、其主要特色。在社交网络演进的过程中,个人的形象由实际生活中的具体个人转化为一个虚拟形象。所有的这一切都归功于社交网络的诞生,然后又驱使人们提出网络扩展和降低成本的特征之间的联系。良好的社交网络数据分析技术可以在社交网络的爆炸式发展的过程中为用户们创建一个积极乐观的网络环境和氛围。9 流行的社交网络如今被认为是社交加网络,即通过将网络作为载体,将很多的用户连接以形成具有一定特性的虚拟社区。和基础科学不同,对社交网络的数据分析重点是人与人之间的相互联系[1],而不仅仅是独立个体的属性。社交网络分析就是研究这种社会结构的,它主要检查关系之间的结构和组成,并分析其
6、结构特点[2]。通常包括: 1)个体的邻接点之间是如何连接的; 2)彼此之间经常进行通信的个体[3](社区); 3)通过网络传递信息所涉及的个体数[4](路径长度); 4)实际网络中可能存在的关系的比重[5](密度)。 2数据挖掘在社交网络中的具体应用――LinkedIn中的职业网络聚类 2.1LinkedIn中数据挖掘的意义 LinkedIn是全球最大的职业社交网站,它主要关注用户的职业和相互之间的商业关系,即“人脉”。LinkedIn的理想定位为年轻职业人员,被广泛地用于构建和维护外部职业网络。因为LinkedIn的管理团队认为用户的职业数
7、据本质上是私有的,并且这些数据非常宝贵,不能像Facebook或Twitte上的好友那样任意查看。由于这类数据的敏感性,LinkedIn中API提供的数据和一般社交网站是有本质区别的[6]。LinkedIn限制用户访问自己“一度人脉”的某些信息,因此它不适用于作为图挖掘。本章下面的内容将介绍如何用基本的聚类分析来帮助用户找到以下几个问题的答案: 1)你的哪些“人脉”和你的职位最相似? 2)你的哪些“人脉”曾在想去的公司工作过? 3)你的大多数“人脉”住在什么地方? 2.2使用聚类分析的动机9 聚类分析可以作为一个单独的工具被用以发现数据库中分布的一
8、些深层的信息,然后归纳出每一类的特点,或者把注意力放
此文档下载收益归作者所有