特征选择方法综述

特征选择方法综述

ID:4135947

大小:219.56 KB

页数:4页

时间:2017-11-29

特征选择方法综述_第1页
特征选择方法综述_第2页
特征选择方法综述_第3页
特征选择方法综述_第4页
资源描述:

《特征选择方法综述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、CN4321258/TP计算机工程与科学2005年第27卷第12期ISSN10072130XCOMPUTERENGINEERING&SCIENCEVol127,No112,2005文章编号:10072130X(2005)12200682043特征选择方法综述ASurveyofFeatureSelection122王娟,慈林林,姚康泽122WANGJuan,CILin2lin,YAOKang2ze(1.北京理工大学信息科学技术学院,北京100081;2.信息高技术研究所,北京100085)(1.SchoolofInform

2、ationScienceandTechnology,BeijingInstituteofTechology,Beijing10081;2.InformationHigh2Technology,Institute,Beijing10085,China)摘要:本文总结并提出了较为完备的特征提取定义。根据特征子集形成过程将特征选择分为穷举式、启发式和随机式三类;根据特征评价标准将特征选择分为距离测度、信息测度、相关性测度、一致性测度和分类器错误率五类。通过分析特征选择的影响因素,提出了选择特征、选择方法应该遵循的原则。Abst

3、ract:Thispaperanalyzesandsummarizesthepreviousdefinitionoffeatureselection,andthenintroducesaself2con2taineddefinition.Itdividesfeatureselectionintothreeclassesaccordingtotheselectingstrategy,andcategorizesthemeth2odsintofivestylesbytheevaluationfunction.Througha

4、nalyzingtheinfectionfactorsinthefeatureselectiontechnology,thispaperintroducessomeprinciplestopavethewayforpractitionerswhosearchforsuitablefeaturestosolvereal2worldapplications.关键词:特征选择;模式识别;特征评价Keywords:featureselection;recognition;featureevaluation中图分类号:TP391.

5、4文献标识码:A选择两个方面:特征提取广义上指的是一种变换,将处于高1引言维空间的样本通过映射或变换的方式转换到低维空间,达到降维的目的;特征选择指从一组特征中去除冗余或不相特征选择在模式识别领域中扮演着一个极其重要的角关的特征来降维。二者常联合使用,如先通过变换将高维色。一方面,在样本有限的情况下,用大量特征来设计分类特征空间映射到低维特征空间,然后再去除冗余的和不相器无论是从计算开销还是从分类器性能来看都不合时宜;另一方面,特征和分类器性能之间并不存在线性关系,当特关的特征来进一步降低维数。本文用“特征获取”来统称特

6、征数量超过一定限度时,会导致分类器性能变坏。因此,进征选择和提取。行正确有效的特征选择成为模式识别中必须要解决的问至今为止,有很多学者从不同角度出发对特征获取进题,在海量数据条件下尤为重要。目前,国外有不少学者对行过定义:Kira[2]定义理想情况下的特征获取为寻找必要[1~12]此进行了研究,提出了许多方法;国内这方面研究还的、足以识别目标的最小尺寸特征子集;John[3]从提高预测不很充分,多数情况下仍采用实验比较来选取特征。精度角度定义特征获取为选择特征子集来增加分类精度,本文主要目的是通过对各种特征选择方法的分类

7、来给或者在不降低分类器精度的条件下降低特征集维数的过出解决特征选择问题的一般性原则。[4]程;Koller从类分布的角度定义特征获取为:在保证结果类分布尽可能与原始数据类分布相似的条件下,选择尽可2特征获取过程[5]能小的特征子集;Dash给出的定义是选择尽量小尺寸的经典特征选择定义为从N个特征集合中选出M个特特征子集,并满足不显著降低分类精度和不显著改变类分[1]布两个条件。上述各种定义出发点不同,各有侧重点,但均征的子集,并满足条件M≤N。它包括特征提取和特征3收稿日期:2004203216;修订日期:2004205

8、228基金项目:武器装备预先研究课题(403010503)作者简介:王娟(1977),女,湖南湘阴人,博士生,研究方向为图像处理、SAR信息处理和模式识别。通讯地址:100085北京市海淀区清河上园4272703信箱;Tel:13661118469;E2mail:wangjuan@china.com.cnAddres

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。