基于半监督和局部降维的多标记数据分类

基于半监督和局部降维的多标记数据分类

ID:36666178

大小:5.38 MB

页数:61页

时间:2019-05-13

基于半监督和局部降维的多标记数据分类_第1页
基于半监督和局部降维的多标记数据分类_第2页
基于半监督和局部降维的多标记数据分类_第3页
基于半监督和局部降维的多标记数据分类_第4页
基于半监督和局部降维的多标记数据分类_第5页
资源描述:

《基于半监督和局部降维的多标记数据分类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中图分类号UDCTP391620硕士学位论文学校代码!Q§三3密级公开基于半监督和局部降维的多标记数据分类Muki—labelclassificationbasedsemi—supervised●‘●●●●●J‘andlocalizeddimensionreduction作者姓名学科专业研究方向学院(系、所)指导教师论文答辩日期:卢小燕:电子与通信工程:数据挖掘:信息科学与工程学院:李宏教授答辩委员会主席堑乏醴幺中南大学二零一三年四月一令一二,平必月原创性声明本人声明,所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了论文中特另tlDil以标注和致

2、谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。作者签名:陋日期:丛链月丛日学位论文版权使用授权书本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文,允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科学技术信息研究所将本学位论文收录到《中国学位论文全文数据库》,并通过网络向社会公众提供信息服务。日期:_年上月劣日基于

3、半监督和局部降维的多标记数据分类摘要:目前,大量的有价值的多标记数据运用到生活的各个领域,但是,现实生活中要获得有标记的、有学习意义的已标记数据很难,要花费大量的人力物力财力。半监督学习(直推式学习)的提出是为了同时利用有标记和无标记数据样本信息进行学习。因此,多标记数据的半监督分类是当前机器学习和数据挖掘领域的热点问题。现有的有关多标记直推式学习方式都是单向的:从有标记样本到未标记样本的直推式游走,或是从未标记样本到有标记样本的直推式游走方法。考虑到单向的直推式游走方法不能全面的利用数据之间的信息,本文提出一种新的直推式学习方法——双向马尔科夫随机游走(TMRW)算法。算法基

4、于从有标记到未标记、从未标记到有标记的双向游走方式,综合双向游走的结果作为直推式游走的最终结果。并基于TMRW作为基分类器学习算法,采用Adboost.MH集成学习作为学习框架来提高该算法的学习性能。实验表明,TMRW与传统的多标记分类算法比较,在多个性能指标上能得到很好的结果。高维多标记数据容易获得,但目前能够很好地对多标记高维度数据集进行分类的算法较少,本文提出一种局部主成分分析线性降维方法(LPCA),对属于同一个簇的、结构一致的数据样本利用主成分分析法在局部范围进行降维。实验过程中,与现有的全局PCA降维算法、多标记半监督判别分析降维算法(MSDA)进行比较,降维后结合

5、双向马尔科夫随机游走算法进行分类,结果表明,对高维多标记数据集进行维度约减预处理,得到简洁、纯粹的数据,提高了该数据集的分类性能和效率。本文的研究成果为高维多标记数据降维以及在少量标记样本下的多标记分类学习提供了有效的方法,并结合集成学习框架提高了多标记数据分类性能,在多标记分类学习中具有一定的参考价值。关键词:多标记分类;直推式学习;双向游走;局部主成分分析;降维分类号:TP391IIMulti—labelClassificationbasedonSemi·supervisedandLocalizedDimensionReductionAbstract:Atpresent,a

6、lotofvahablemulti-labeldatasetisappliedtoa11areasoflire.however,itisverydif&ulttogetthemarkedandsignificantivedataset,thiswillcostalotoflabour,matchlandfinancialresources.T11eproposalofsemi—supervisedlearningortransductivelearningistoutilizethemarkedandunmarkedsamplesatthesametime,Thustostud

7、ymulti-labeldatasets.Sothesemi-supervisedlearningformulti.1abeldataisthecurrenthotissuesinthefieldofmachinelearninganddataminmg.Existingrelatedtransducfivelearningformulti-labellearningareone.way,thatislearningisdonefromlabeledtounlabeledsamplesorv

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。