数据分析参考资料.doc

数据分析参考资料.doc

ID:49655294

大小:141.00 KB

页数:7页

时间:2020-03-03

数据分析参考资料.doc_第1页
数据分析参考资料.doc_第2页
数据分析参考资料.doc_第3页
数据分析参考资料.doc_第4页
数据分析参考资料.doc_第5页
资源描述:

《数据分析参考资料.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据分析复习资料一、填空1.数据分布左偏态(负偏),说明在均值的数据更为分散;两侧极端数据较多,说明数据分布的峰度。2.回归方程显著性检验是对的一个整体性检验。3.设Q是X=JX、X“…、X,的相关系数矩阵,其特征值按大小顺序排列为相应的正交单位化特征向量为才疋;,…“;,则X/J第R个主成分可表示为O4.设兀,y是来自均值向量为“、协方差矩阵为工的总体G的两个样品,则间的马氏平方距离是o5・数据分布峰度为正,说明数据屮含有远离均值的极端数值。6.回归系数检验是对逐一作显著性检验。7.设工是x=(X

2、,x”・・、x〉「的协方差矩阵,其特征值按大小顺序排列

3、为人n入n…n蚣no,相应的正交单位化特征向量为,则X的第P个主成分可表示为。8.设有两个总体q和G?,其均值向量分别是“和G和G?的协方差矩阵相等,皆为工,则总体G和G?间的马氏平方距离是。二、判断题1.复相关系数平方F越大,说明因变量y与白变量x、,X2,…,的线性关系越显著。()2.对于线性回归模型Y=X0+£,£〜"((),

4、类间的距离,从而按照类间趾离从小到大进行聚类。()5.冋归平方和SS/?越大,说明因变量Y与白变量X

5、,X2,•…,X心的线性关系越显著。()6.设q〜7V(&16),G?〜N(16,16),如果Xo=13,则XogG,(X)o()7.快速聚类法适合于样品数目较大的数据集的聚类分析,但需要事先指定分类的数目,此数目对最终分类结果有较大影响。()8•偏度&是刻画数据分布对称的指标,若厲<0,此时均值大于屮位数,均值右边的数据更为分散。()A6.对于线性回归模型Y=X0+£,0的最小二乘估计是0NX’X)"和/的估计是o-=—-—YtU一H)Y。()n-p7.

6、在线性回归分析中总离方和可分解为SST=SSE十SSR,其^SSR越大反应了丫与X"…,Xp_的线性关系越明显。()‘0、8.用最短距离法进行谱系聚类吋,若三个样品的距离矩阵是30,则先将样詁20,二和三聚为一类。三、测最某小学60名11岁学生的身高(单位:cm),得测最数据(略)。调用SAS软件PROCUNIVARIATE过程对数据进行描述性分析,以下是输出结果。根据程序输岀结果:1.分析学生身高的数字特征:均值、屮位数、三均值、上,下四分位数。2.分析学生身高的分散性特征:方差、标准差、变异系数、极差、四分位极差。3.运用偏度、峰度分析学生身高的分布

7、形状。输出结果:TheUNIVARIATEProcedureVariable:shengaoMomentsN60SumWeights60Mean139SumObservations8340StdDeviation7.06387324Variance49.8983051Skewness-0.5100771Kurtosis-0.1261294UncorrectedSS1162204CorrectedSS2944CoeffVariation5.08192319StdErrorMean0.91194211BasicStatisticaIMeasuresLocati

8、onVariabiIityMean139.0000StdDeviation7.06387Median139.0000Variance49.89831Mode142.0000Range31.00000IrrterquartiIeRange9.50000Quantiles(Definition5)QuantileEstimate100%Max151.099%151.095%149.090%147.575%Q3144.550%Median139.025%QI135.010%128.55%126.51%120.00%Min120.0四、某科学基金会的管理人员欲了解

9、从事研究T作的屮、高水平的数学家的年工资额Y与他们的研究成果的质量指标从事研究工作的时间X?以及能成功获得资助的指标X3之间的关系。为此按一定的设计方案调ST24位此类型的数学家,得数据(略)。假设Y与X„X2,X3Z间满足线性回归关系x=0o+0m+02兀2+03兀3+岂,心1,2,・・・,24,其中哲独立同分布于N(0&)。调用SAS过稈的PROCREG过稈进行线性冋归分析。根据下面输出结果作出分析:1.求复相关系数的平方A?的值并解释其意义。2.检验冋归方程是否显著,并写出冋归方程。3・分析各个线性冋归系数的显著性检验结果(ct=0.05并求A的9

10、5%的置信区问(r0975(20)=2.086)o1.假定某位数学

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。