数据分析上机实验模拟题.doc

数据分析上机实验模拟题.doc

ID:51767417

大小:922.00 KB

页数:15页

时间:2020-03-15

数据分析上机实验模拟题.doc_第1页
数据分析上机实验模拟题.doc_第2页
数据分析上机实验模拟题.doc_第3页
数据分析上机实验模拟题.doc_第4页
数据分析上机实验模拟题.doc_第5页
资源描述:

《数据分析上机实验模拟题.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据分析上机实验模拟题一.第一章数据的描述性分析1.建立数据集设有数据集如下:LIMING2356170LIUHUA2560174ZHANGWEI3065165相应变量分别为NAME,AGE,WEIGHT和HEIGHT,输入数据以建立一个名为exe_1的SAS数据集,并打印输出.2.数据的描述性分析例1.2对血清蛋白含量,利用PROCUNIVARITE过程,求数据的方差、标准差、变异系数、极差、四分位极差、四分位标准差,程序如下:练习:利用MEANS过程求上述基本统计量。二.回归分析1.线性回归模型及其参数估计(模型及矩阵表示、参数估计及性质);矩阵表示2.统计推断(

2、回归方程的显著性检验、回归系数的显著性检验、预测及其置信区间、与回归系数有关的假设检验的一般方法);(1)回归方程的显著性检验:,,检验假设:,统计量,时,拒绝(2)回归系数的统计推断:检验假设,统计量,,拒绝的置信区间:(3)预测及统计推断:的置信区间:3.残差分析及处理措施(误差的正态性检验、残差图分析、Box-Cox变换);(1)误差的正态性检验1)残差正态性的频率检验2)残差的正态QQ图检验近似一条直线,(2)残差图分析3)Box-Cox变换选择,使最小4.回归方程的选取(1)穷举法评价回归方程优良性的准则:修正的复相关系数准则;准则,预测平方和准则(2)逐步

3、回归法例2.3某科学基金会的管理人员欲了解从事研究工作的中、高水平的数学家的年工资额Y与他们的研究成果的质量指标、从事研究工作的时间以及能获得资助的指标.为此按一定的设计方案调查了24位此类型的数学家,得数据如书上表2.3所示.(1)假设误差服从分布,建立与之间的线性回归方程并研究相应的统计推断问题.(2)假设某位数学家的关于的值为,试预测他的年工资额并给出置信度为95%的置信区间.三.方差分析----单因素1.单因素方差分析(1)统计模型因变量Y—因素,水平,上观测值,,(2)显著检验,拒绝.(3)置信区间(略)置信度的置信区间,置信度的置信区间为个的置信度至少的同

4、时置信区间2.双因素等重复试验下的方差分析(1)统计模型Y—因素和B,水平,,组合水平观测值,为无偏估计.假设成立时,分别服从分布.(2)显著检验假设检验问题:统计量检验值:如,拒绝相应假设(3)无交互效应的各因素均值的估计与比较(4)有交互效应时因素各水平组合上的均值估计与比较例3.1为比较同一类型的三种不同食谱的营养效果,将19只幼鼠分为三组,每组分别为8只、4只、7只,各采用这三种食谱喂养.假定其他条件均保持相同,12周后测得其体重增加量如表3.3所示,设体重增加服从方差分析模型(3.1)或(3.2),试比较这三种食谱的营养效果是否有显著差异.表3.3三种食谱下

5、幼鼠的体重增加量食谱体重增加量甲164190203205206214228257乙185197201231丙187212215220248265281四.主成分分析、典型相关分析1.主成分分析(1)基于协方差矩阵的总体主成分的求法(基于相关系数矩阵类似)—维随机变量,协方差阵非负定.主成分定义:满足:(1)系数向量单位化;(2)各主成分不相关,无重叠信息,;(3)主成分方差由此递减.求总体主成分步骤:1)解,求的p个特征值;2)对应的正交单位化的特征向量分别为;其中,3)的第个主成分为;为个主成分构成的随机向量4)主成分的贡献率与累计贡献率——第k个主成份的贡献率——

6、前k个主成份的累积贡献率(2)基于样本协方差矩阵的主成分分析(基于样本相关系数矩阵类似)来自于总体的容量为的样本观测数据,样本协方差矩阵其中,为的样本均值步骤:1)求特征值2)相应的正交单位化特征向量,3)第个样本主成分,4)——第k个样本主成分的贡献率——前k个主成分的累积贡献率5)第个样本主成分的个观测值称为第个样本主成分的得分,可以依据得分对各组样本观测数据进行排序()样本主成分的观测数据(得分向量)例4.3对10名男中学生的身高()、胸围()、体重()进行测量,得数据如表4.2,从协方差矩阵出发对其做主成分分析,按照第一主成分排名.表4.210名男中学生的身高

7、、胸围及体重数据序号身高x1(cm)胸围x3(cm)体重x3(cm)1149.569.538.52162.577.055.53162.778.550.84162.287.565.55156.574.549.06156.174.545.57172.076.551.08173.281.559.59159.574.543.510157.779.053.52.典型相关分析(1)总体典型变量的定义设有两组随机变量,的协方差矩阵为其中这里假定满秩矩阵(为正定矩阵),不妨设.1)构造典型变量为第对典型变量.确定,满足(2)总体典型变量与典型相关系数的求法(1)求,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。