基于微博短文本的用户兴趣建模方法-论文.pdf

基于微博短文本的用户兴趣建模方法-论文.pdf

ID:58298850

大小:404.17 KB

页数:5页

时间:2020-05-04

基于微博短文本的用户兴趣建模方法-论文.pdf_第1页
基于微博短文本的用户兴趣建模方法-论文.pdf_第2页
基于微博短文本的用户兴趣建模方法-论文.pdf_第3页
基于微博短文本的用户兴趣建模方法-论文.pdf_第4页
基于微博短文本的用户兴趣建模方法-论文.pdf_第5页
资源描述:

《基于微博短文本的用户兴趣建模方法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第40卷第2期计算机工程2014年2月、,0l-40NO.2ComputerEngineeringFebruary2014·开发研究与工程应用-文章编号:1000___3428(2014)02—0275—05文献标识码:A中图分类号:TP393基于微博短文本的用户兴趣建模方法邱云飞lp王琳颍1,邵良杉,郭红梅(1.辽宁工程技术大学软件学院,辽宁葫芦岛125100;2.辽宁工程技术大学系统工程研究所,辽宁阜新123000;3.阜新市实验高中,辽宁阜新123000)摘要:针对微博用户兴趣建模问题,提出

2、一种在微博短文本数据集上建立用户兴趣模型的方法。为缓解短文本造成的数据稀疏性问题,在分析微博短文本结构和内容的基础上,给出微博短文本重构概念,根据微博相关的其他微博短文本和文本中包含的3种特殊符号,进行文本内容的扩展,从而扩充原始微博的特征信息。利用HowNet2000概念词典将重构后文本的特征词集映射到概念集。以抽象到概念层的文本向量为基础进行聚类,划分用户的兴趣集合,并给出用户兴趣模型的表示机制。实验结果表明,短文本重构和概念映射提高了聚类效果,与基于协同过滤的微博用户兴趣建模方法相比,平衡均

3、值提高29.1%,表明构建的微博用户兴趣模型具有较好的性能。关健词:微博;短文本重构;概念映射;短文本聚类;用户兴趣模型UserInterestModelingApproachBased0nShortTextofMicro—blogQIUYun.fei,WANGLin.ying,SHAOLiang.shan,GUOHong.mei3(1.SchoolofSoftware,LiaoningTechnicalUniversity,Huludao125100,China;2.SystemEngineer

4、ingInstitute,LiaoningTechnicalUniversity,Fuxin123000,China;3.ExperimentalHighSchoolofFuxin,Fuxin123000,China)[Abstract]Inthispaper,amethodonmodelinglaser’sinterestsbasedonshorttextofmicro—blogispresented.Inordertoovercomethelackofinformationinshorttex

5、t,onthebaseofanalyzingthestructureandcontentofmicro—blogshorttext,thispaperproposesanapproachonmicro—blogshorttextreconstruction,andnamely,accordingtotheotherrelatedandthethreekindsofspecialsymbolsofthetext,extendsthecontent,therebyextendingthecharact

6、eristicinformationoforiginalmicro—blog.IttakesadvantageofHowNet2000conceptdictionarytomapthefeaturesetofreconstructiontexttoasetofconcepts.Itclustersthesetofconceptstodivideuser’sinterests,andmeanwhile,arepresentationmechanismofuserinterestmodelispres

7、ented.Experimentalresultsshowthattheshorttextreconstructionandconceptmappingcanimprovetheefectofclustering.Comparedwiththemodelingbasedoncollaborativefiltering,F-Measurevalueisincreasedby29.1%.Thismeanstheproposedmicro—bloguser’sinterestmodelinghasabe

8、tterperformance.[Keywords]micro.-blog;short.-textreconstruction;conceptmapping;short--textclustering;userinterestmodelDOI:10.3969/j.issn.1000—3428.2014.02.060用户所发表、转发和评论的信息内容来获取用户的兴趣,1概述建立兴趣模型,基于这样的兴趣,与其他用户兴趣模型进近年来,微博以其便捷、及时的信息分享、传播和获行相似度匹配来推荐

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。