基于多标签学习的社交网络用户人格预测方法研究

基于多标签学习的社交网络用户人格预测方法研究

ID:35063712

大小:2.57 MB

页数:66页

时间:2019-03-17

基于多标签学习的社交网络用户人格预测方法研究_第1页
基于多标签学习的社交网络用户人格预测方法研究_第2页
基于多标签学习的社交网络用户人格预测方法研究_第3页
基于多标签学习的社交网络用户人格预测方法研究_第4页
基于多标签学习的社交网络用户人格预测方法研究_第5页
资源描述:

《基于多标签学习的社交网络用户人格预测方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391单位代码:10183研究生学号:2013532064密级:公开研吉林大学硕士学位论文(学术学位)基于多标签学习的社交网络用户人格预测方法研究ResearchonPersonalityPredictionMethodofSocialNetworkUsersBasedonMulti-LabelLearning作者姓名:郑惠中专业:计算机软件与理论研究方向:数据挖掘与机器学习指导教师:左万利教授培养单位:计算机科学与技术学院2016年5月基于多标签学习的社交网络用户人格预测方法研究ResearchonPersonalityPredictionMethodofSocial

2、NetworkUsersBasedonMulti-LabelLearning作者姓名:郑惠中专业名称:计算机软件与理论指导教师:左万利教授学位类别:工学硕士答辩日期:2016年5月25日未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学硕:t学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用

3、的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作.对本文的研巧做出重要贡献的个人和集体品成果。,均己在文中W明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名;有裝t一日期:2016年S月卖日摘要摘要基于多标签学习的社交网络用户人格预测方法研究随着Internet的迅速普及,社交网络开始在大众生活中扮演重要的角色,人们通过社交网络进行交流互动正在成为一种重要的沟通方式,借助网络社交平台发表观点、联系好友、讨论公共话题等,社交网络成为了现实社会的延伸。每时每刻都有大量用户在公共社交网站(如Facebook)上频繁活动,或

4、浏览信息,或更新状态,随着用户在社交网络中的需求越来越多,如何提供个性化服务已经成为网络社交平台智能化的研究热点,如好友推荐,商品推广等。人格特质作为影响用户行为的重要因素之一,可对个性化服务质量的提高产生重要的作用,对社交网络用户的人格进行分析和预测具有广阔的应用前景。在人格心理学领域有多种不同的人格流派,其中,特质流派给人格提供了一种相对科学可靠的分析和量化的可能。人格特质流派目前最可靠、最主流的模型是大五人格模型,它从五个方面来描述一个人的人格,这五个维度分别为外向性、神经质或情绪稳定性、宜人性或随和性、尽责性以及开放性,大五人格模型认为人格由多种性格特征所组成并且结构相对稳

5、定。大五人格与人们在生活中的行为有关,同时也与网络行为具有很强的相关性,可以利用网络挖掘技术,通过建立网络行为特征与人格特质之间的关系计算模型,来实现通过社交网络信息对用户的人格特质进行预测。近年来,对社交网络用户人格预测的相关研究开始出现,相比于自陈量表的人格计算手段,利用网络信息进行自动化的人格预测具有便利性与客观性。研究者们面向用户网络文本信息及可获得的其它相关信息,进行相应的特征提取,并采用如kNN,SVM,朴素贝叶斯以及决策树等不同的机器学习算法,构建人格预测模型。大量实验结果表明,基于社交网络信息,可以有效地进行自动化的用户人格预测。但目前工作中预测结果的准确性并不是特

6、别理想,需要给出更好的适合于用户人格预测问题的自动化预测方法,以及进一步从网络社交平台用户生成的信息中挖掘出与人格特I摘要质具有高度相关性的特征,并探索人格特质之间的内在联系。本文基于上述问题,主要做了以下工作:针对用户在社交网站上的文本状态信息,面向人格预测,提出了结合基于词的形式特征与语义特征的特征设计方案。其中,基于词的形式特征包括基于信息增益提取的词特征,情感特征,语法上的词性与时态特征,以及写作风格特征,并依据特征与类别标签集合的相关性,运用MLFSIE-W算法进行特征选择与加权;语义特征方面,基于WordNet通用本体映射,定义了概念向量,并给出了结合语义距离与语义重合

7、度的文本语义相关度计算方法;最后根据语义相关度和基于词特征的相似度,给出了综合相似度计算方法。在实验中,与相关工作采用的各种特征基于相同的机器学习算法进行了对比,随后还讨论了形式特征和语义特征在人格预测中的作用。针对用户人格预测的相关研究中通常采用单标签机器学习算法处理的问题,本文采用一种基于随机游走模型的多标签用户人格预测方法来进行分析和处理。因为通过对大五人格的分析以及用户人格特质的表现形式,人格预测问题在本质上应该属于一种多标签学习问题。在执行随机游走模型算法的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。