主成分分析在数学建模中的应用.doc

主成分分析在数学建模中的应用.doc

ID:56674169

大小:451.50 KB

页数:11页

时间:2020-07-04

主成分分析在数学建模中的应用.doc_第1页
主成分分析在数学建模中的应用.doc_第2页
主成分分析在数学建模中的应用.doc_第3页
主成分分析在数学建模中的应用.doc_第4页
主成分分析在数学建模中的应用.doc_第5页
资源描述:

《主成分分析在数学建模中的应用.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、`第一讲主成分分析在数学建模中的应用1.学习目的1.理解主成分分析的基本思想;2.会用SAS软件编写相关程序,对相关数据进行主成分分析;3.会用SAS软件编程结合主成分分析方法解决实际问题。2.学习要求1.理解主成分分析的基本原理,掌握主成分分析的基本步骤;2.会用SAS软件编写相关程序,对相关数据进行分析处理和假设检验;3.撰写不少于3000字的小论文;4.精读一篇优秀论文。3.理论基础3.1基本思想在实际问题的研究中,往往会涉及众多的变量。但是,变量太多不但会增加计算的复杂性,而且也给合理地分析问题和解释问题带来困难。一般来说,虽然每个变量提供了一定的信息,但其重要性有所

2、不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数较少的互不相关的新变量来反映原来变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析就是在这种降维的思想下产生的处理高维数据的方法。3.2基本原理(1).总体的主成分定义1.设为P维随机向量,称为X的第i主成分(i=1,2,…P),如果:(1)(2)当i>1时,(3)定理1.设是P维随机向量,且,的特征值为Word文档`,为相应的单位正交特征向量,则X的第i主成分为定义2.我们称为主成分的贡献率;又称为主成分的累计贡献率

3、。记,,其中为的特征值,是相应的单位正交特征向量,记正交矩阵主成分,其中则总体主成分有如下的性质:性质1.,即P个主成分的方差为:,且它们是互不相关的。性质2.,通常称为原总体X的总方差(或称总惯量)。性质3.主成分与原始变量的相关系数为并把主成分与原始变量的相关系数称为因子负荷量。性质4.。性质5.若记,即令这时标准化后的随机向量的协方差阵就是原随机向量X的相关阵R。从相关阵R出发求主成分,记主成分向量为,则有与总体主成分相应的性质:性质1.,其中为相关矩阵R的特征值。Word文档`性质2..性质3.主成分与标准化变量的相关系数为,其中是R对应于的单位正交特征向量。性质4.

4、性质5.。2.样本的主成分定义1.设变量的n次观测数据阵X已标准化,这时样本的协方差阵就是样本相关阵R,且R的特征值为,其相应标准化特征向量为,样本主成分为类似总体主成分,样本主成分也具有如下的性质:性质1.(因为=0),而上式说明当时,第i个主成分得分向量与第j个主成分得分向量是相互正交的。性质2.。称为样本主成分的贡献率;又称为样本主成分的累计贡献率。性质3.样本主成分具有是残差平方和最小的优良性。3.3基本步骤⑴数据标准化其中,为第列的方差;Word文档`⑵计算协方差矩阵;⑶计算协方差矩阵的特征值与特征向量;利用特征方程求出按大小排列特征值以及相应的特征向量;⑷选择前几

5、个特征向量,确定主成分;3.4基本命令使用procprincomp过程进行主成分分析,其主要语句格式如下:Procprincomp<选项列表>;Var变量列表;Run;其中:(1)Procprincomp语句用来规定输入、输出和一些运行选项,其选项及功能如下:①data=数据集名1:指明所要分析的数据集,若省略则表示分析最新生成的数据集。②out=数据集名2:命名一个输出SAS数据集,其中包含原始数据以及各主成分得分(即各主成分的观测值)。③outstat=数据集名3:命名一个包含各变量的均值、标准差、相关矩阵或协方差矩阵、特征值和特征向量的SAS数据集。④covarianc

6、e(cov):要求从协方差矩阵出发作主成分分析,若省略此选项,则从相关矩阵出发进行分析;除非各变量的度量单位是可比较的或已经过某种方式的标准化,否则不宜使用此选项,应从相关矩阵出发作主成分分析。⑤N=n:指定要计算的主成分的个数,其默认值为参与分析的变量的个数。⑥prefix=name:规定各主成分名称的前缀。省略此句则SAS系统自动赋予各主成分名称分别为prin1,prin2,……;若“name=A”,则各主成分名称分别为A1,A2,……,前缀的字符个数加上后面数字位数应不超过8个字符。(2)VARvariables;此句中的“variables”部分列出数据集中参与主成分

7、分析的变量名称。若省略此句,则被分析数据集中所有数值变量均参与分析。4.举例Word文档`【例1】(中学生身体四项指标的主成分分析)在某中学随机抽取某年级30名学生,测量其身高(X1)、体重(X2)、胸围(X3)和坐高(X4),(数据见教材P277的表7.4)。试对这30名学生体四项指标数据做主成分分析。datad721;inputnumberx1-x4;cards;114841727821393471763160497786414936677951594580866142316676715343768

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。