回归系数的假设检验(7)

回归系数的假设检验(7)

ID:14117270

大小:196.50 KB

页数:9页

时间:2018-07-26

回归系数的假设检验(7)_第1页
回归系数的假设检验(7)_第2页
回归系数的假设检验(7)_第3页
回归系数的假设检验(7)_第4页
回归系数的假设检验(7)_第5页
资源描述:

《回归系数的假设检验(7)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、回归系数的假设检验前面所求得的回归方程是否成立,即X、Y是否有直线关系,是回归分析要考虑的首要问题。我们知道即使X、Y的总体回归系数b为零,由于抽样误差,其样本回归系数b也不一定为零。因此需作b是否为零的假设检验,可用方差分析或t检验。.P(x,y)Y-------------------------------------------------X应变量Y的平方和划分示意图任一点P的纵坐标被回归直线与均数截成三段:第一段,表示实测点P与回归直线的纵向距离,即实际值Y与估计值之差,称为剩余或残差。第二段,即Y估计值与均数之差,它与回归系数的大小有关。

2、b

3、

4、值越大,也越大,反之亦然。当b=0时,亦为零,则=,也就是回归直线不能使残差减小。第三段,是应变量Y的均数。依变量y的总变异由y与x间存在直线关系所引起的变异与偏差两部分构成,即上式两端平方,然后对所有的n点求和,则有由于,所以于是=0所以有反映了y的总变异程度,称为y的总平方和,记为;反映了由于y与x间存在直线关系所引起的y的变异程度,称为回归平方和,记为;反映了除y与x存在直线关系以外的原因,包括随机误差所引起的y的变异程度,称为离回归平方和或剩余平方和,记为SSr。总变异SS总是由回归关系引起的SS回和与回归无关的其它各种因素产生的SS剩所构成。若回归直线

5、与各实测点十分吻合,则SS回将明显大于SS剩,当全部实测值都在回归直线上时,SS总=SS回,SS剩=0,反之,若回归直线拟合不好,SS回相对较小,SS剩则相对增大。可见SS回/SS剩反映了回归的效果。上式又可表示为:这表明y的总平方和划分为回归平方和与离回归平方和两部分。与此相对应,y的总自由度也划分为回归自由度与离回归自由度两部分,即在直线回归分析中,回归自由度等于自变量的个数,即;y的总自由度;离回归自由度。于是:离回归均方,回归均方(1)、方差分析法:具体计算如下:1、建立无效假设:H0:β=0,即胆固醇与年龄之间无直线关系H1:β≠0,即胆固醇与年龄之间

6、有直线关系α=0.052、计算SS总=88.8081df总=19SS回=blxy=0.141(453.7385)=63.9771df回=1SS剩=SS总—SS回=88.8081-63.9771=24.8310df剩=18方差分析结果表变异来源SSdfMSF总变异88.808119回归63.9771163.977146.377剩余24.8310181.37953、查表确定p值F0.05(1,18)=4.41,F0.01(1,18)=8.29P<0.01故按α=0.05水准拒绝无效假设,接受备择假设。4、结论:可以认为高血脂病人治疗前胆固醇与年龄由直线关系。(2)、

7、t检验基本思想与样本均数与总体均数比较的t检验类似,而检验统计量t值的计算按下式完成:df=n-2本例n=20,SS剩=1.3795,lxx=3216.95,b=0.141按df=18,查t界值表,t0.05(18)=2.101,t0.01(18)=2.878,按a=0.05水准,拒绝H0,接受H1,结论同上。直线回归方程的应用统计预测:1、总体回归系数β的区间估计根据参数估计原理,回归系数b是总体回归系数β的点估计,正像样本均数不一定恰好等于总体均数一样,需要对总体回归系数β进行区间估计。式中Sb为回归系数的标准误;n-2为自由度。回归方程为根据资料的样本回归

8、系数b=0.141估计总体回归系数β的95%可信区间。已知b=0.141,sb=0.0207,t0.05(18)=2.101则总体回归系数β的95%可信区间为(0.141-2.1010.0207,0.141+2.1010.0207)=(0.0975,0.1977)2、的区间估计是指总体中自变量X为某一定值X0时,的总体均数。对的估计可计算可信区间:式中即的标准误,可按下式计算:式中SY.X为剩余标准差。当时,,此时,可信区间的范围最窄,预测精度相对较高。试计算当X0=50岁时,的95%可信区间。已知,,sy.x=1.175=2.661+0.14150=9.71t

9、0.05(18)=2.101当X0=50时,的95%可信区间为(9.71-2.1010.3418,9.71+2.1010.3418)=(8.99,10.43)即当年龄为50岁时,估计其胆固醇的的总体均数在(8.99,10.43)范围内的可能性为95%。3、个体Y值的容许区间总体中,X为一定值时,个体Y值的波动范围,可按下式求出:式中SY为X取一定值时,个体Y值的标准差,其计算公式为试计算当X0=50时,个体Y值的95%容许区间。已知=9.71,t0.05(18)=2.101,SY.X=1.175故当X0=50岁时,个体Y值的95%容许区间为:(9.71-2.10

10、11.2230,9.71

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。