实验五相关和回归分析

实验五相关和回归分析

ID:30138738

大小:898.54 KB

页数:20页

时间:2018-12-27

实验五相关和回归分析_第1页
实验五相关和回归分析_第2页
实验五相关和回归分析_第3页
实验五相关和回归分析_第4页
实验五相关和回归分析_第5页
资源描述:

《实验五相关和回归分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、实验五相关和回归分析相关分析是指对变量之间的相关关系进行描述与度量的一种分析方法,简单相关分析通常指对两变量间相关关系的研究,其目的是确定两个变量之间是否存在相关关系,并对其相关关系的强度进行度量,常用方法是考察两个变量的散点图和计算变量间的相关系数。多元线性回归分析研究多个变量的数量伴随关系,内容主要包括模型的假定与检验、参数的估计与检验、回归诊断与预测。很多非线性回归问题都可以转化为线性回归问题处理,如多项式回归、指数回归、对数回归、幂函数回归等。5.1实验目的掌握使用SAS进行简单相关分析和

2、多元线性回归分析及非线性回归分析的方法。5.2实验内容一、用INSIGHT模块作简单相关分析与一元线性回归分析二、用“分析家”作多元线性回归分析三、使用REG过程作回归分析四、一元非线性回归分析5.3实验指导一、用INSIGHT模块作简单相关分析与一元线性回归分析【实验5-1】比萨斜塔是一建筑奇迹,工程师关于塔的稳定性作了大量研究工作,塔的斜度的测量值随时间变化的关系提供了很多有用的信息,表5-1给出了1975年至1987年的测量值(sy5_1.xls)。表中变量“斜度”表示塔上某一点的实际位置与

3、假如塔为垂直时它所处位置之偏差再减去2900mm。表5-1比萨斜塔的斜度年份x75767778798081828384858687斜度y(1/10mm)642644656667673688696698713717725742757试分析y(斜度)关于年份x的相关关系,写出y关于x的线性回归方程,并利用所建回归方程预测1988年时比萨斜塔的斜度值。1.数据的导入首先将上表在Excel中处理后导入成SAS数据集Mylib.sy5_1,如图5-1所示,其中x表示年份y表示斜度。    20    图5-

4、1数据集Mylib.sy5_12.制作散点图制作斜度y与年份x的散点图,以便判断变量之间的相关性。步骤如下:(1)在INSIGHT中打开数据集Mylib.sy5_1。(2)选择菜单“Analyze(分析)”→“ScatterPlot(YX)(散点图)”。(3)在打开的“ScatterPlot(YX)”对话框中选定Y变量:Y;选定X变量:x,如图5-2左所示。(4)单击“OK”按钮,得到斜度y与年份x的散点图,如图5-2右所示。从散点图中可以看出,斜度y与年份x之间具有一定的线性关系。图5-2斜度y

5、与年份x的散点图3.相关系数计算在INSIGHT中打开数据集Mylib.sy5_1。(1)选择菜单“Analyze(分析)”→“Multivariate(YX)(多变量)”。(2)在打开的“Multivariate(YX)”对话框中选定Y变量:y;选定X变量:x,如图5-3左所示。.图5-3计算相关系数(3)单击“OK”按钮,得到结果如图5-3右所示。结果显示斜度y与年份x的样本相关系数很大,为0.994。(4)为了检验总体变量y与x的相关系数是否为零,选择菜单:“Tables”→“CORRp-v

6、alues”,得到相关系数为零的原假设的p值,如图5-4所示。图5-4相关系数的检验由于p值很小,应拒绝原假设,可以认为斜度y与年份x之间均存在着显著的正相关关系。4.一元线性回归在INSIGHT中打开数据集Mylib.sy5_1。(1)选择菜单“Analyze”→“Fit(YX)(拟合)”,打开“Fit(YX)”对话框。(2)在“Fit(YX)”对话框中,选择变量Y,单击“Y”按钮,将Y    20    设为响应变量;选择变量x,单击“X”按钮,将x设为自变量,如图5-5左所示。(3)单击Ou

7、tput按钮,在“Fit(YX)”输出选项表中增加选中ResidualNormal复选项,要求输出残差的正态QQ图,如图5-5右所示。图5-5“Fit(YX)”输出选项设置(4)两次单击“OK”按钮,得到分析结果。显示的结果分为若干张表,其中第二张表给出回归方程:方程表明回归直线截距的估计值为-61.1209,斜率的估计值为9.3187,如图5-6左下。回归系数9.3187表示比萨斜塔的“斜度”年平均增加9.3187。图5-6回归方程与散点图第三张表是带有回归直线的散点图,给出了回归的图形表示,如

8、图5-6右。图的下面是参数回归拟合表(图5-7)。图5-7参数回归拟合表其中判定系数R-Square(R2)=0.9880,指出x能够解释Y的98.8%的信息。还有1–98.8%=1.2%的信息不能被解释,这些信息由其他变量和随机因素所解释。图5-8拟合汇总表第四张拟合汇总表(图5-8)中MeanofResponse(响应变量的均值)693.6923是变量Y的样本平均值,RootMSE(均方残差平方根)4.181是对各观测点在直线周围分散程度的一个度量值,为随机误差ε的标准差(也是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。