基于偏最小二乘回归的多标签分类算法研究

基于偏最小二乘回归的多标签分类算法研究

ID:36666138

大小:3.00 MB

页数:63页

时间:2019-05-13

基于偏最小二乘回归的多标签分类算法研究_第1页
基于偏最小二乘回归的多标签分类算法研究_第2页
基于偏最小二乘回归的多标签分类算法研究_第3页
基于偏最小二乘回归的多标签分类算法研究_第4页
基于偏最小二乘回归的多标签分类算法研究_第5页
资源描述:

《基于偏最小二乘回归的多标签分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Multi--LabelClassificationAlgorithmBasedonPartialLeastSquaresRegressionThesisSubmittedtoZhejiangNormalUniversityInpartialfulfillmentoftherequirementForthedegreeofMasterofScienceinEngineeringQian—·deRen(ComputerSoftwareandTheory)ThesisSupervisor:Professor

2、Fa--rongZhongandShi·-chaoZhangMay,2013基于偏最,j、--乘回归的多标签分类算法研究摘要当今社会,随着计算机硬件和软件技术的快速发展,不断涌现出大量功能强大且价格合理的数据存储介质。数据存储能力的极大提升推动了数据库技术的快速发展。大量的数据库系统被用来管理大容量存储介质上的海量数据。但由于缺乏有效的管理工具,隐藏在这些海量数据背后的有用知识却不能被人们所发现和利用。为了有效地将这些知识用于科学研究、欺诈检测、生产管理、市场分析、工程规划等领域,从海量数据中发现这些知

3、识的工具——数据挖掘技术得到了蓬勃的兴起和发展。分类是数据挖掘中进行数据分析的一个重要研究方向。它从预先定义的数据类中得出一个分类模型来预测未分类的数据。在传统的分类中,每个样本仅有一个标签,它们属于单标签分类。然而在许多实际应用中,每个样本同时拥有几个不同的标签,这些属于多标签分类。近年来,由于多标签数据的普遍存在和广泛的应用价值,越来越多的研究者对其产生了浓厚的兴趣。随着多标签分类问题研究的不断深入,人们将各种不同的学习方法应用到多标签分类问题中,提出了大量的多标签分类学习算法,解决了实际应用中的很

4、多不同问题。例如,在多元统计分析中,典型相关分析是研究两组多维变量之间相互关系的一种技术,它已经成功地应用到多标签分类问题中。同样地,在多元统计分析中,偏最小二乘回归具有多元线性回归和主成分分析的优点,它也能够通过一组多维变量预测另一组多维变量。偏最小二乘回归通过最小二乘回归拓展而来,在化学领域得到了最初的应用。近年来,偏最小二乘回归在经济、水利、环保和电力等领域都得到了广泛的应用,并取得了良好的效果。在分类问题中,偏最小二乘回归作为降维方法与其它方法相结合进行过分类,也直接作过单标签分类方法。但偏最小

5、二乘回归还未直接应用于多标签分类问题中。本文研究基于偏最小二乘回归的多标签分类问题,主要研究内容包括:(1)Eh于偏最小二乘回归能够将两组多维变量相关联,并能通过一组多维自变量预测另一组多维因变量,因而将偏最小二乘回归方法与多标签分类相结合,提出基于偏最小二乘回归的多标签分类算法。首先,基于非线性迭代偏最小二乘算法构建偏最小二乘回归模型;然后,根据多标签分类的特点,将训练集中的训练数据通过偏最小二乘回归得到一个多标签分类模型,再通过这个多标签分类模型对测试集中的测试数据进行多标签分类。(2)将基于偏最小

6、二乘回归的多标签分类算法在现实中的多标签数据集上进行仿真实验。在实验的过程中,将该多标签分类算法与其它的多标签分类算法进行对比,以验证其良好的多标签分类性能。在对比的过程中,采用十字交叉验证法进行验证,并采用多标签分类的性能评价准则对实验结果进行评价。实验结果表明基于偏最d、---乘回归的多标签分类算法在多标签分类性能上明显优于其它的多标签分类算法。关键词:多标签分类;偏最小二乘回归:性能评价准则;数据挖掘IIMIⅡ,TI—LABELCLASSIFICATIONALGORITHMBASEDONPARTI

7、ALLEASTSQUARESREGRESSIONABSTRACTInmoderntimes,astherapiddevelopmentofcomputerhardwareandsoftwaretechnology,muchpowerfulandreasonablestoragemediacomesforth.Thegreatboostofthestoragecapacityleadstotheamazingprogressofthedatabasetechnology.Alargenumberofdat

8、abasesareusedtomanagethehugedataOllthestoragemedia.Buttheusefulknowledgehiddeninthehugedatacannotbediscovered,withoutthepowerfulmanagementt001.Inordertoeffectivelyapplythisknowledgetoscienceresearch,frauddetection,producti

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。