毕业论文--回归分析和残差分析

毕业论文--回归分析和残差分析

ID:35646954

大小:348.52 KB

页数:14页

时间:2019-04-06

毕业论文--回归分析和残差分析_第1页
毕业论文--回归分析和残差分析_第2页
毕业论文--回归分析和残差分析_第3页
毕业论文--回归分析和残差分析_第4页
毕业论文--回归分析和残差分析_第5页
资源描述:

《毕业论文--回归分析和残差分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、江西农业大学毕业论文论文题目:回归分析和残差分析学院名称:理学院专业:信息与计算科学学生姓名:学号:指导教师:2011年5月日回归分析和残差分析摘要回归分析师应用极其广泛的数理统计方法之一,它基于观测数据建立变量间适当的相关关系,以分析数据的内在规律,并可用于预报、控制等问题在数理统计基础部分,我们已经学习了一元线性回归分析的基本内容,即当影响因变量Y的因素只有一个(记为Y)时,如何建立Y于X的适当的线性回归关系,在实际问题中,影响Y的因素往往很多,本文讨论多元线性回归模型的系统建模方法,主要包括模型的参数估计、假设检验、残差分析等,而在诸如对回归函数的线性

2、假设、误差的正态性和同方差性假设等都有可能不适合所给数据,因此拟合一个模型之后进一步考察模型对所给数据的适用性是必须的,而且也是十分重要的一个环节,为使拟合的模型较好的反映数据的特点,通过残差分析对模型作必要的修正或者对数据作某些处理就起着十分重要的作用关键词回归分析SAS编程残差分析线性诊断目录1.分析目的2.分析原理2.1多元回归分析原理与方法简述2.1.1回归方程的建立2.1.2回归方程的显著性检验(-检验)2.1.3回归系数的显著性检验(-检验)2.1.4利用回归方程进行预测2.2回归诊断的简述2.2.1线性回归模型的假定:2.2.2残差及其性质2.

3、2.3回归函数线性的诊断;2.2.4误差方差齐性的诊断,2.2.4.1Hartley检验(水平重复次数相等)2.2.4.2Cochran检验(水平重复次数相等)2.2.4.3Barlett检验2.2.5误差的独立性诊断2.2.6异常点与强影响点2.2.6.1异常点2.2.6.2强影响点2.3实例分析2.3.1建立多元线性回归模型2.3.1.1回归分析2.3.1.2残差分析2.4参考文献1.分析目的(1)熟悉运用SAS编程进行数据整理和加工;(2)掌握用SAS编程进行多元回归分析;(3)用残差图进行回归函数线性诊断,误差方差齐性的诊断,误差的独立性诊断,异常点

4、和强影响点的判断;(4)会用回归方程进行预测。2.分析原理2.1多元回归分析原理与方法简述2.1.1回归方程的建立多元线性回归是研究因变量与个自变量之间的线性相关关系的.设是一个可观测的随机变量,它受非随机变量和随机因素的影响.若与有如下关系:其中是未知参数,并假定~.对Y、X作n次观测,得到n组数据设分别是的估计值,称为多元线性回归方程,称为回归系数.确定可根据最小二乘法,使残差平方和达到最小,即由多元函数求极值的方法,得正规方程可由正规方程求得其中,,,.2.1.2回归方程的显著性检验(-检验)检验假设检验统计量为~若拒绝,则回归模型显著.2.1.3回归

5、系数的显著性检验(-检验)检验的目的是把次要的变量从回归方程中剔除,重新建立更为简洁的回归方程.检验假设检验统计量为~其中,为正规方程系数矩阵的逆的对角线上一个元素.注意:在剔除变量时,每次只剔除一个,如果有几个变量经检验都不显著,则先剔除其中值最小的一个变量,然后对所求的新回归方程的回归系数进行检验,有不显著的再剔除,直到保留的变量都显著为止.2.1.4利用回归方程进行预测对于给定的,求预测区间.①计算回归值:②写出的可靠性为的预测区间2.2回归诊断的简述2.2.1线性回归模型的假定假设1自变量是确定性变量,不是随机变量,且,即是满秩矩阵。假设2满足高斯-

6、马尔科夫条件,即假设3正态分布的条件2.2.2残差及其性质称为帽子矩阵,因为将因变量的观测值向量变换成响应变量的拟合值向量,残差向量被定义为残差的性质:(1);(2);(3)若时,标准化残差:,其中是的第个元素,标准化残差近似服从标准正态分布,且近似的相互独立。残差图:以残差或为纵轴标,以拟合值或自变量,或观测时间或序号等为横坐标的散点图。利用残差图可对于模型假设的合理性进行检验。2.2.2回归函数线性的诊断;2.2.3误差方差齐性的诊断,2.2.3.1Hartley检验(水平重复次数相等)其拒绝域为,其中是总体个数,各水平重复的次数,而且当为零或很小,或时

7、,不能用此检验。2.2.3.2Cochran检验(水平重复次数相等)其拒绝域为2.2.3.3Barlett检验其中,是第个样本的容量,,,当中有一个为零或很小时,此检验不能用。2.2.4误差的独立性诊断D-W检验其中为一阶自相关系数,根据DW的值可按下面规则判断:当时,认为间存在正相关;当时,认为间存在不相关;当认为间存在负相关;当或时,对于是否相关暂不能下结论.2.2.5异常点与强影响点2.2.5.1异常点异常点通常是指数据中的极端点或来自与其模型不同的数据点。常用的诊断统计量有:标准化残差的绝对值≥2的观测值认为是可疑点,而标准化残差的绝对值≥3的观测值

8、认为是异常点;外学生化残差检验统计量,其拒绝域为2.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。