欢迎来到天天文库
浏览记录
ID:53575649
大小:326.73 KB
页数:4页
时间:2020-04-19
《基于科研在线文档库平台的标签推荐系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第40卷第5期计算机工程2014年5月、,olJ40NO.5ComputerEngineeringMay2014·开发研究与工程应用一文章编号:1000-3428(2014)05·0295—04文献标识码:A中图分类号:TP39基于科研在线文档库平台的标签推荐系统蔡芳L,沈一,南凯(1.中国科学院计算机网络信息中心,北京100190;2.中国科学院大学,北京100049)摘要:科研在线文档库是一个面向团队的文档协同与管理工具,为虚拟团队提供合作平台。它采用标签系统的方式组织其中的所有文档。在文档库的使用过程中,出现了无标签文档数量
2、的累积以及用户为文档添加的标签质量偏低问题,影响文档的分类和共享。针对该问题,采用适用于科研在线文档库平台的标签推荐方法,包括协同过滤以及关键词抽取2个部分,促使用户为文档添加合格的标签,提高文档系统的使用效率。协同过滤推荐部分的实验采用准确率和召回率衡量标准,关键词抽取部分采用用户调查的实验方式,实验证明为每个文档提供3个候选标签能够得到理想效果。在实际使用环境中,该系统具有较高的精确度和可靠性,简单易于实现。关健词:标签推荐;标签系统;协同过滤;关键词抽取;冷启动;文档协同TagRecommendationSystemBase
3、d0nDucklingDocumentLibraryPlatformCAIFang,一,SHENYi,一,NANKai’(1.ComputerNetworkInformationCenter,ChineseAcademyofSciences,Beijing100190,China;2.UniversityofChineseAcademyofSciences,Beijing100049,China)[Abstract]DucklingDocumentLibrary(DDL)isatoolfordocumentcollaboratio
4、nandmanagementamongresearchteams.Itprovidesacooperationplatformforvirtualteams.TagsystemisusedtomanageaUthedocumentsonit.Duringtheuseofthelibrary,thenumberofdocumentswithoutanytagsisgraduallyaccumulatingandthequalityoftagslabeledbyuserstosomedocumentsisnotsogood.Allth
5、esetroublesimpedetheeffectivecontrolofthedocuments.Inordertosolvetheseproblems,thispaperproposesatagrecommendationmethodsuitableforthedocumentlibraryofresearchonlineplatform,whichincludescollaborationfilteringrecommendationandkeywordsextractionrecommendation,inthisway
6、usersarepromptedtoaddqualifiedtagsandimprovetheeficiencyofthedocumentlibrary.Precisionandrecallratemetricsareusedinthecollaborationfilteringrecommendationandusersurveyinthekeywordsextractionrecommendation.Experimentalresultsshowthatarecommendedlistofthreetagscangetdes
7、iredefect.Inproductionenvironment,thistagrecommendationsystemhasqualifiedaccuracy,reliabilityandiseasytobeimplemented.[Keywordsltagrecommendation;tagsystem;collaborativefiltering;keywordsextraction;cold—start;documentcollaborationDOI:1O.39698.issn.1000-3428.2014.05.06
8、1群众自发性定义的平面非等级标签分类,用于信息的分类1概述和共享。目前比较流行的UGC标签系统有书签类站点Web2.0下,用户行为由Web1.0中获取信息转变为以交Delicious、论文书签网站CiteULike、相片分享网站Flickr等。互为
此文档下载收益归作者所有