考试统计与测量第五章.ppt

考试统计与测量第五章.ppt

ID:52390937

大小:208.56 KB

页数:29页

时间:2020-04-05

考试统计与测量第五章.ppt_第1页
考试统计与测量第五章.ppt_第2页
考试统计与测量第五章.ppt_第3页
考试统计与测量第五章.ppt_第4页
考试统计与测量第五章.ppt_第5页
资源描述:

《考试统计与测量第五章.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章回归分析§5.1一元线性回归(一)§5.1一元线性回归(二)§5.1一元线性回归(三)§5.1一元线性回归(四)§5.1一元线性回归(五)§5.1一元线性回归(六)§5.2相关系数的其他表示法(一)§5.2相关系数的其他表示法(二)§5.1一元线性回归(一)回归分析是一种研究变量之间相关关系的统计方法,相关关系是指随机变量与随机变量之间的关系,相关关系和我们熟知的变量间的函数关系是不同的,函数关系是一种确定性关系,由一个变量的值可以精确得出另一个变量的值,例如,圆周长,知道了直径d就一定能得到精确的周长C值。变量x与y之间相关关系最简单的一种是线性相关关系,即x与

2、y之间可以用线性函数y=a+bx来近似表示它们之间的关系,如果这种关系式成立,我们可以由x的值得出y的估计值。设x、y为随机变量,如果x与y具有线性相关关系,我们的目的是要通过样本找出x与y之间近似直线方程表达式(5.1.1)其中称为回归直线,称为回归系数。一、如何配直线我们先假定x、y之间存在线性相关关系,要配回归直线,关健在于求出。对x、y进行n次独立实验得到n对样本数据,代入直线方程y和回归直线方程,而y与之间存在误差,设在每一个点处的误差为。由于有n个样本点对值,故有n个误差,我们设总误差为。显然,我们不能用代数和表示,这是因为误差有正有负,代数和中正负各项会抵

3、消,如果用误差的绝对值之和来表示,虽然可以避免上述缺点,但绝对值不便于进行代数运算,因此,我们用各个误差的平方和来表示,即由微积分求极值原理,总误差达到最小值时,须满足方程组(5.1.2)解此方程组(5.1.3)(5.1.4)再把代入(5.1.1)式,即得到y对x的回归直线方程,我们称以上确定的方法为最小二乘法。由于这样选择的使达到最小值,因此,回归直线是所有可能直线中最接近实验数据点的直线,也就是说,用回归直线表示x与y之间的线性相关关系与实际数据的误差比任何其它直线都小。例1从某大学数学系一年级抽出15名学生数学分析成绩和高考数学成绩数据如表5.1,试建立对回归直线

4、方程。高考成绩数学分析成绩161723721518443922707049004900490038390688981007470455623025384434105777459295476569868085640072256800765814225372139658757656255776570096467409644894288107278518460845616116862462438444216127480547664005920138583722568897055146467409644894288表5.1159093810086498370总和10831120

5、795158507082083解:由表5.1中数据得因此,故。§5.1一元线性回归(二)二、相关系数1、样本相关系数类似于总体相关系数的定义,样本相关系数定义为其中为样本协方差,为x的样本方差,为y的样本方差。如果记,则是(5.1.6)。实际上,是总体相关系数r在统计中的具体样本实现值。例1中。§5.1一元线性回归(三)2、平方和分解公式由于从而若记则(5.1.7)称(5.1.7)式为总离差的平方和分解公式。又可见,U是总离差中由于x与y线性关系引起y变化的部分,称之为回归平方和,y的这部分离差可以通过控制的y值而掌握。是所有实验点距回归直线y的离差平方和,是由总离差中

6、分离出x对y的线性影响之外的其余偶然因素产生的误差(即随机波动产生的误差),称之为残差平方和或剩余平方和。由此我们可以看出,回归效果的好坏取决于与的大小,在总离差中占的比重越大,则回归效果越好。这表明,的绝对值越大,也越大,而越小,说明x对y的线性影响部分越显著,回归效果越好。由于当时,称x与y不相关;时,称x与y为正全相关;时,称x与y为负全相关;时,称此为正相关;时,称此为负相关。§5.1一元线性回归(四)三、相关性检验1、相关系数法的值与数据的个数n有关。附表13(相关系数临界值表)给出了显著性水平下相关系数达到显著的起码值,表中n-2为残差平方和的自由度,这是因

7、为总离差平方和自由度为n-1,而回归平方和对应于自变量的个数只有1个,又,故的自由度为n-1-1=n-2。如果,我们说在的水平下线性相关性显著,越小显著程度越高。例1中,给定n=15,查自由度为15-2=13的相关系数临界值表得到,而,因此x与y显著线性相关,所配直线方程是有意义的。2、利用F检验判断线性相关性衡量x与y之间有无线性关系,如果它们之间没有线性关系,那么,说明x的变化对y没有影响,这相当于检验假设。在H0成立的条件下,构造统计量F(方差比)(5.1.9)给定显著性水平,查自由度为的分布单侧临界值表(附表6)得到临界值,如果x

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。