基于聚类正则化的线性判别分析

基于聚类正则化的线性判别分析

ID:15476774

大小:1006.00 KB

页数:68页

时间:2018-08-03

基于聚类正则化的线性判别分析_第1页
基于聚类正则化的线性判别分析_第2页
基于聚类正则化的线性判别分析_第3页
基于聚类正则化的线性判别分析_第4页
基于聚类正则化的线性判别分析_第5页
资源描述:

《基于聚类正则化的线性判别分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于聚类正则化的线性判别分析LinearDiscriminantAnalysisBasedonClusteringRegularization学科专业:信息与通信工程研究生:王爽指导教师:庞彦伟教授天津大学电子信息工程学院二零一三年十二月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的

2、说明并表示了谢意。学位论文作者签名:签字日期:年月日学位论文版权使用授权书本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:导师签名:签字日期:年月日签字日期:年月日摘要近些年,多媒体和网络技术发展迅速,促使了图像数据数量的大幅度增长,因此如何能够快速、准

3、确地获取图像数据中的有用信息成为急需解决的问题,而维数约简技术作为其中的一种解决方案,现已成为一个非常热门的研究方向。到目前为止,最具有标志性的两种方法分别为主成分分析(PrincipalComponentAnalysis,PCA)和线性判别分析(LinearDiscriminantAnalysis,LDA)。LDA是一种有监督的维数约简方法,其基本思想是找到一个最佳的投影方向,使投影到该方向上的样本数据的类间离散度最大,同时类内离散度最小。但当每个类别中的训练样本数目较少时,LDA方法却存在着严重的过拟合问题,而造成这种

4、现象的主要原因是根据有限数目的训练样本计算得到的类间散布矩阵和类内散布矩阵与理想的类间散布矩阵和类内散布矩阵之间存在着较大的偏差。为了解决这个问题,本文提出在不增加训练样本数目的情况下,充分利用给定训练数据自身的结构信息,先运用k-均值聚类算法形成新的样本数据,计算新样本数据的类间散布矩阵和类内散布矩阵。然后利用新样本数据的类间散布矩阵来归一化原始样本数据的类间散布矩阵,同时,利用新样本数据的类内散布矩阵来归一化原始样本数据的类内散布矩阵。这里,新样本数据的类间散布矩阵和类内散布矩阵对结果的贡献值是与每个类别中训练样本的数

5、目成反比例关系的。最后,本文分别在AR人脸数据库和FERET人脸数据库以及Carreira-Perpinan人耳数据库上做了大量的实验,证明了本文提出的算法的优势之处。关键词:LDA维数约简特征提取人脸识别ABSTRACTInrecentyears,multimediaandnetwoktechniquesdeveloprapidly,anditpromotesthenumberofimagedatatoincreaseatanamazingrate.Sohowtoobtaiontheusefulinformationqu

6、icklyandaccuratelyfromalotofimagedatabecomesaurgentproblem,anddimensionredutiontechniquewhichisasakindofsolutionhasbeenaveryhotresearchtopic.Sofar,therearetwoimportantmethods,oneisPrincipalComponentAnalysis(PCA)andtheotherisLinearDiscriminantAnalysis(LDA).LDAisasa

7、superviseddimensionalityreductiontechnique,itsmainideaisthatfindinganoptimalprojectiondirectionfirstly,andthatthenprojectingthesampledatatothisdirectiontoensurethatthenewbetween-classdispersionislargestandthenewwithin-classdispersionissmallestrespectivelyandsimult

8、aneously.However,whenthenumberoftrainingsamplesperclassissmall,LDAhasseriousoverfittingproblem.Themainreasonisthatthebetween-classandwithin-classscatter

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。