社交网络用户行为系统探究

社交网络用户行为系统探究

ID:46147157

大小:61.00 KB

页数:4页

时间:2019-11-21

社交网络用户行为系统探究_第1页
社交网络用户行为系统探究_第2页
社交网络用户行为系统探究_第3页
社交网络用户行为系统探究_第4页
资源描述:

《社交网络用户行为系统探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、社交网络用户行为系统探究【摘要】随着网络迅猛发展,网络社交成为人们交友、联系的新方式,如何建设一个人性化的社交网络,建设人性化的社交网站的依据是什么?如果更好的为用户服务?这些问题归结到社交网络用户行为的分析上,对用户行为数据进行分析,根据不同用户的行为属性分类进行数据挖掘,从而得出不同类型用户的习惯和偏好【关键词】社交网络用户行为数据挖掘在WEB0志挖掘的过程中,信息的采集和清洗是个很重要的过程,特别是有目的进行数据的归类,为了更好的实现我们的研究目的,我们针对性的对WEB日志进行处理原理进行分析1用户行为的分类根据用户访问的目的

2、进行用户行为的分类,本文利用用户典型的访问行为进行分类,根据用户对某些订阅信息产生的特征向量从而发现用户的个人和社交的信息。我们对用户的特征向量进行聚类分析,得出用户的不同类型分组,区别与其他的兴趣度的研究方向,典型的行为研究更加简洁和显著优酷是中国最大的视频网站之一,优酷提供了一个很重要的用户社交和交互功能,我们将视频分类,用户的功能有:添加好友,分享视频,关注好友的视频,留言互动,视频评级,视频标注热爱度等。我们根据这些点进行用户分类,每个用户为一个节点,两个节点的用户进行交互时,产生''订阅向量”,一个用户的视频会直接分享到另

3、一个用户,并且随着用户交互的数量增多,类似订阅的用户聚类,即相近兴趣聚类(1)根据广度优先算法进行随机抽选访问用户的信息,对随机抽选的用户进行具体的跟踪和调查,由一个用户扩展到和他相关联的用户,如同滚雪球一样关联的用户越来越多,收集的信息也随着增多,直到手动停止结束(2)根据被其他用户订阅数量的排名进行筛选用户,排名最高的用户作为最初的集合,从最初的集合向下扩张(3)用户向量表示法:每个用户为一个向量,长度为9,每个向量包含该用户所有的信息:1)用户上传视频的数量:表示访问用户上传不同视频数量。2)浏览视频的数量:表示访问用户访问不

4、同视频数量,区分潜在消费者。3)创建账号时间:表示访问用户创建该账号时间。4)账号年龄:表示访问用户在该社交网络活动时间。5)用户聚类系数:表示访问用户之间紧密系数,例如:A用户访问B,B访问C,则A访问C的系数增加。6)订阅潜在值:表示某访问用户订阅数量从而推测现在的消费用户。7)被订阅制造值:表示A用户被其他访问用户订阅的总数量,进而找到视频制造用户。8)订阅用户数量:表不A用户订阅其他用户的数量。9)交互潜在性:表示用户相互订阅系数。针对每个属性进行规范化,每个属性都分布0到1区间值(4)基于用户访问距离聚类:利用K-mean

5、s算法进行用户访问距离分组,欧式距离作为访问用户之间的分组依据,即通过信号的相似度进行做距离向量的值,信号越相似距离越近,距离越近越容易聚类为一个组(5)通过聚类向量法相算法中的K值是影响用户访问特征向量的关键,因此我们选择K值是关键2测试分析我们通过对Web服务器记录日志的流程进行数据采集,通常情况下WEBserver日志文件和server位于同一❷—服务器,分析的方法一般2种:(1)编写日志分析代码在服务器上,当进行日志分析时启动分析程序代码,整个过程在服务器进行,分析完成我们只需要把分析结果取回,然后反馈到客户端。这样省去了网

6、络带宽的要求,不需要大数据的传送,减轻了客户端的负载(2)利用FTP把服务器端的日志文件传到客户端,在客户端进行日志文件的分析,这种方式的优点是减轻了服务器的压力,但是同时在传输数据时占用带宽,因为我们采样的日志文件一般超过几百兆或者几个G大小,如果客户端和服务器地理位置相对较远,这种方式不合理本文采用的是第一种方法,流程为上图1-2所示,在服务器端进行数据分析处理Web服务器:负责接收客户端的分析请求,并将分析结果最终形成的WEB页面发送给客户端CGI程序:把从Webserver传送过来的请求传送给日志分析程序,接收日志分析程序分

7、析的结果并以页面的形式发送给Web服务器日志分析程序:接收CGI程序传送来的分析请求,从日志文件里读数据,分析后把结果传给CGI程序设置2个分类向量:A1和A2,计算它们之间的距离,D为向量长度。算法的伪代码:1,D

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。