基于标记集合划分的多标记分类算法-论文.pdf

基于标记集合划分的多标记分类算法-论文.pdf

ID:58138395

大小:474.61 KB

页数:7页

时间:2020-04-24

基于标记集合划分的多标记分类算法-论文.pdf_第1页
基于标记集合划分的多标记分类算法-论文.pdf_第2页
基于标记集合划分的多标记分类算法-论文.pdf_第3页
基于标记集合划分的多标记分类算法-论文.pdf_第4页
基于标记集合划分的多标记分类算法-论文.pdf_第5页
资源描述:

《基于标记集合划分的多标记分类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第39卷第3期昆明理工大学学报(自然科学版)Vo1.39No.32014年6月JournalofKunmingUniversityofScienceandTechnology(NaturalScienceEdition)Jun.2014doi:10.3969/j.issn.1007—855x.2014.03.010基于标记集合划分的多标记分类算法何颖婧,王志海,李哲(北京交通大学计算机与信息技术学院,北京100044)摘要:在多标记学习中,标记之间往往既不是完全独立也不是完全排斥的,因此在构建多标记分类器时要充分利用标记之间的依赖关系.目前利用标记间关系的方法有将标记

2、集合划分为子集和将各标记间关系表示为链式两种.本文提出了一种结合上述两种思想的算法,首先根据标记对间的依赖度量值来启发式地对标记集合进行划分,然后在最终的划分子集合间依次建立分类器组成分类器链.通过与其他算法的比较,实验结果表明该算法能提升分类器性能.关键词:多标记;标记关系;分类器链中图分类号:TP311.1文献标志码:A文章编号:1007—855x(2014)03—0054—07AMulti.LabelClassificationAlgorithmBasedonLabelSetPartitionHEYing—jing,WANGZhi—hal,LIZhe(Schoo

3、lofComputerandInformationTechnology,BeijingJiaotongUniversity,Beijing100044,China)Abstract:Labelsinmulti—labellearningareusuallyneithercompletelyindependentnormutuallyexclusive,thereforeitisimportanttoexplorethedependenciesamonglabelsduringbuildingmulti—labelclassifiers.Thereexisttwomet

4、hodstoexploitlabeldependencies:dividingthelabelsetintoseveralsetsandregardingthestructureoflabelsasachain.Inthispaper,anewmulti—labelclassificationalgorithm,whichcombinestheabovetwoapproaches,isproposed.First,itdividesthelabelsetintoseveralsubsetsbasedonlabeldependenciesheuristically.It

5、buildsthereafteraclassifieroneachsubset.Alltheseclassifierscompriseachain.Itisshownthroughtheexperimentthatthisalgorithmoutperformsotheralgorithmsandimprovesmulti-labelclassificationperformance.Keywords:multi—label;labeldependency;classifierchain0引言传统的分类问题都假设一个实例只和一个类标相关,然而很多现实的问题中一个实例往

6、往可以同时属于多个标记.比如一幅图像可能包含多个场景,一条新闻可能同时涉及到政治和经济等.随着多标记学习在文本、图像、视频场景分析、基因功能预测等领域的广泛应用,它受到越来越多研究者的关注,成为机器学习领域研究的热点之一.设D表示数据集,表示标记集合,多标记学习的任务是确定一个映射函数:(A,A,⋯,A)一c,使得对任意的未知类标的实例d={a。,a,⋯,0}可得到适当的标记集合y,yL.目前,多标记学习方法可分为问题转化和算法适应两类⋯.问题转化方法将多标记分类问题转化为一个或多个单标记问题,算法适应方法则扩展传统的分类算法,使其能直接应用于多标记数据.事实上,许多

7、算法适应方法都是将问题转化的思想内嵌在算法中,因此,本文接下来主要讨论问题转化方法.问题转化中最常用的两个算法为标记幂集合算法(LabelPowerSet,LP)和二值相关算法(BinaryRelevance,BR).LP方法将每个标记间的组合都看作一个新的类值,若实例集中有Ⅳ个标记,则标记的可能组合就为2,由于标记的组合情况可收稿日期:2013—05—07.基金项目:国家自然科学基金项目(60973011).作者简介:何颖婧(1990一),硕士研究生.主要研究方向:数据挖掘.E—mail:11120442@bjtu.edu.cn通信作者:王志海(1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。