基于科研在线文档库平台的标签推荐系统.pdf

基于科研在线文档库平台的标签推荐系统.pdf

ID:53575649

大小:326.73 KB

页数:4页

时间:2020-04-19

基于科研在线文档库平台的标签推荐系统.pdf_第1页
基于科研在线文档库平台的标签推荐系统.pdf_第2页
基于科研在线文档库平台的标签推荐系统.pdf_第3页
基于科研在线文档库平台的标签推荐系统.pdf_第4页
资源描述:

《基于科研在线文档库平台的标签推荐系统.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第40卷第5期计算机工程2014年5月、,olJ40NO.5ComputerEngineeringMay2014·开发研究与工程应用一文章编号:1000-3428(2014)05·0295—04文献标识码:A中图分类号:TP39基于科研在线文档库平台的标签推荐系统蔡芳L,沈一,南凯(1.中国科学院计算机网络信息中心,北京100190;2.中国科学院大学,北京100049)摘要:科研在线文档库是一个面向团队的文档协同与管理工具,为虚拟团队提供合作平台。它采用标签系统的方式组织其中的所有文档。在文档库的使用过程中,出现了无标签文档数量

2、的累积以及用户为文档添加的标签质量偏低问题,影响文档的分类和共享。针对该问题,采用适用于科研在线文档库平台的标签推荐方法,包括协同过滤以及关键词抽取2个部分,促使用户为文档添加合格的标签,提高文档系统的使用效率。协同过滤推荐部分的实验采用准确率和召回率衡量标准,关键词抽取部分采用用户调查的实验方式,实验证明为每个文档提供3个候选标签能够得到理想效果。在实际使用环境中,该系统具有较高的精确度和可靠性,简单易于实现。关健词:标签推荐;标签系统;协同过滤;关键词抽取;冷启动;文档协同TagRecommendationSystemBase

3、d0nDucklingDocumentLibraryPlatformCAIFang,一,SHENYi,一,NANKai’(1.ComputerNetworkInformationCenter,ChineseAcademyofSciences,Beijing100190,China;2.UniversityofChineseAcademyofSciences,Beijing100049,China)[Abstract]DucklingDocumentLibrary(DDL)isatoolfordocumentcollaboratio

4、nandmanagementamongresearchteams.Itprovidesacooperationplatformforvirtualteams.TagsystemisusedtomanageaUthedocumentsonit.Duringtheuseofthelibrary,thenumberofdocumentswithoutanytagsisgraduallyaccumulatingandthequalityoftagslabeledbyuserstosomedocumentsisnotsogood.Allth

5、esetroublesimpedetheeffectivecontrolofthedocuments.Inordertosolvetheseproblems,thispaperproposesatagrecommendationmethodsuitableforthedocumentlibraryofresearchonlineplatform,whichincludescollaborationfilteringrecommendationandkeywordsextractionrecommendation,inthisway

6、usersarepromptedtoaddqualifiedtagsandimprovetheeficiencyofthedocumentlibrary.Precisionandrecallratemetricsareusedinthecollaborationfilteringrecommendationandusersurveyinthekeywordsextractionrecommendation.Experimentalresultsshowthatarecommendedlistofthreetagscangetdes

7、iredefect.Inproductionenvironment,thistagrecommendationsystemhasqualifiedaccuracy,reliabilityandiseasytobeimplemented.[Keywordsltagrecommendation;tagsystem;collaborativefiltering;keywordsextraction;cold—start;documentcollaborationDOI:1O.39698.issn.1000-3428.2014.05.06

8、1群众自发性定义的平面非等级标签分类,用于信息的分类1概述和共享。目前比较流行的UGC标签系统有书签类站点Web2.0下,用户行为由Web1.0中获取信息转变为以交Delicious、论文书签网站CiteULike、相片分享网站Flickr等。互为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。