数据分析期末试题(卷)与答案解析.doc

数据分析期末试题(卷)与答案解析.doc

ID:56580669

大小:504.50 KB

页数:19页

时间:2020-06-28

数据分析期末试题(卷)与答案解析.doc_第1页
数据分析期末试题(卷)与答案解析.doc_第2页
数据分析期末试题(卷)与答案解析.doc_第3页
数据分析期末试题(卷)与答案解析.doc_第4页
数据分析期末试题(卷)与答案解析.doc_第5页
资源描述:

《数据分析期末试题(卷)与答案解析.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、数据分析期末试题及答案一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分)解:1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采

2、用曲线估计,得出表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。上图是以疫苗接种率(x3)的三次方()为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间呈正线性关系所以可以采用如下的线性回归方法分析。2.线性回归先用强行进入的方式建立如下线性方程设Y=β0+β1*(Xi1)+β2*Xi2+β3*+εii=1.2……24其中εi(i

3、=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差模型汇总b模型RR方调整R方标准估计的误差1.952a.907.8913.332a.预测变量:(常量),x3,x1,x2。b.因变量:y上表是线性回归模型下的拟合优度结果,由上表知,R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。建立总体性的假设检验提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零得如下方差分析表Anovab模型平

4、方和df均方FSig.1回归1937.7043645.90158.190.000a残差199.7961811.100总计2137.50021a.预测变量:(常量),x3,x1,x2。b.因变量:y上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。做独立性的假设检验得出参数估计表系数a模型非标准化系数标准系数tSig.B标准误

5、差试用版1(常量)33.0143.13710.523.000x1.072.015.4044.865.000x2.169.040.4314.245.000x3.178.049.3393.654.002a.因变量:y上表是有关参数估计的信息,同样是上面的检验假设,H0:β1=β2=β3=0:H1:β1、β2、β3不全为零由表知,β1=33.014,β1=0.072,β2=0.169,β3=0.178,以β1=0.072为例,表示当成人识字率(x2),一岁儿童疫苗接种率(x3)不变时,,人均GDP(x1)每增加一个单位,平均寿命(y)就增加0.072个单位。

6、基于以上结果得出年平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有显著性的线性关系有回归方程Y=33.014+0.072*X1+0.169*X2+0.178*X3β1、β2、β3对应得p值分别为0.000,0.000,0.002,对应的概率p值都小于0.05,表示它们的单独性的假设检验没通过,即该模型是最优的,所以不用采用逐步回归的方式分析。对原始数据进行残差分析未标准化的残差RES_1-7.53964-3.57019-3.42221-2.89835-2.30455-2.17263-2.05862-1.37142

7、-1.17048-.43890-.17260-.03190.946551.428961.612521.615902.101393.018563.025713.498084.607375.29645以X1为横轴,RES_1为纵轴画出如下散点图由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。同理可以得出RES_1与X2、X3的散点图,由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理。由上图可以看出,该残差图中各点分布近似长条矩形,所以模型拟合较好,即该线性回归模型比较合理

8、。误差项的正态性检验数据(RES_1)标准化残差ZRES_1由图可以看出,散点图近似的在一条直

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。