一种支持向量机的样本约简方法

一种支持向量机的样本约简方法

ID:46598647

大小:262.68 KB

页数:4页

时间:2019-11-26

一种支持向量机的样本约简方法_第1页
一种支持向量机的样本约简方法_第2页
一种支持向量机的样本约简方法_第3页
一种支持向量机的样本约简方法_第4页
资源描述:

《一种支持向量机的样本约简方法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、文章编号:2095-1248(2016)03-0063-04信息科学与工程一种支持向量机的样本约简方法张国栋,肖娅,周炬,郭薇(沈阳航空航天大学计算机学院,沈阳110136)摘要:支持向量机算法求解会涉及矩阵的存储与运算,因此算法的时空复杂度较大,这些不足之处限制了支持向量机的应用。为提高支持向量机的训练速度,缩短训练时间,提出一种样本约简方法。该方法通过两次样本约简,剔除掉大部分非边界样本,保留少数且有效的样本作为训练集。然后,采取KNN算法去除约简后训练集中的孤立点和噪音点。最后,对UCI标准数据集中的Breast-Cancers数据进行实验,支持

2、向量减少了25个,训练时间减少了7ms,而准确率却得到了提高。实验结果表明,在保证预测精确度的前提下,该算法能够有效进行样本约简,缩短训练时间。关键词:样本约简;支持向量机;边界样本;核函数;KNN中图分类号:TP391.41文献标志码:Adoi:10.3969/j.issn.2095-1248.2016.03.010MethodofsamPlereductionforSuPPortVectorMachineZHANGGuo-dong,XIAOYa,ZHOUJu,GUOWei(CollegeofComputerScience,ShenyangAeros

3、paceUniversity,Shenyang110136,China)Abstract:SupportVectorMachine(SVM)involvesthestorageandcalculationofthematrix.Therefore,thehugespaceandtimeinvolvedlimittheapplicationofSVM.Inordertoimprovethetrainingspeedandsavestoragespace,thispaperpresentedamethodtoreducethenumberofthetrai

4、ningdata.Firstly,themethodre-movedmostofthenon-boundarysamplesandkeepsonlyafewsamplesastrainingdatabytwostepsreduc-tion.Then,KNNwasusedtoremovesomenoise.Breast-CancersofUCIstandarddatasetswereemployedtoevaluateourmethod.Twenty-fivedatawereremovedfromthesetofsupportvectorsandthet

5、rainingtimewasdecreasedby7ms,whiletheaccuracyofclassificationhasimproved.Theexperimentalresultshowsthattheproposedmethodcaneffectivelyreducethenumberoftrainingdata,anddecreasethetrainingtimewiththeincreaseintheaccuracyofclassification.Keywords:samplereduction;SVM;boundarysample;

6、kernelfunction;KNN支持向量机(SupportVectorMachine,SVM)论发展而来,它在人脸识别、目标跟踪、工业检测、[1-2]算法是根据Vapnik等人提出的统计学习理网络入侵检测等领域都取得了很好的应用效收稿日期:2015-11-03基金项目:国家自然科学基金(项目编号:61373088),国家自然科学基金(项目编号:61402298),航空基金(项目编号:2013ZE54025)作者简介:张国栋(1972-),男,黑龙江牡丹江人,教授,主要研究方向:医学图像处理,E-mail:zhanggd@sau.edu.cn。64沈

7、阳航空航天大学学报第33卷[3-7]果。但SVM的本质是求解数学上的凸二次拉格朗日乘子,就变为求解两个变量的优化问题。[11]规划问题,涉及矩阵的存储和运算操作。因此,算(2)基于边界样本选取的思想。李青等人法的时空复杂度较大,这影响了SVM的运算效提出一种基于向量投影的支持向量预选取方法。[12]率以及在大规模数据上的应用。目前,相关研究Shin等人提出了一种基于KNN算法的支持向[13]学者分别从如下两个角度提高SVM的训练速量预选取方法。汪西莉等人提出了一种利用度,缩短训练时间:马氏距离选取支持向量(SV)的方法改进SVM。[8](1)基于分解的

8、思想。Vapnik等人在本文提出一种支持向量机的样本约简方法。1995年提出选块算法,其思想是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。