回归分析与相关分析

回归分析与相关分析

ID:39416458

大小:2.64 MB

页数:52页

时间:2019-07-02

回归分析与相关分析_第1页
回归分析与相关分析_第2页
回归分析与相关分析_第3页
回归分析与相关分析_第4页
回归分析与相关分析_第5页
资源描述:

《回归分析与相关分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、课程安排回归模型与相关分析方差分析属性数据分析生存数据分析实验设计全基因组关联分析第1,2,3,5次ExperimentalDesignandDataAnalysisforBiologistsGerryP.QuinnandMichaelJ.KeoughCambridgeUniversityPress,Cambridge,2002.2.BiostatisticalDesignandAnalysisUsingR:APracticalGuideMurrayLoganWiley-Blackwell,Chichester,WestSussex,2010.第4次3.SurvivalAnalysis:

2、ASelf-LearningText,2ndeditionDavidG.KleinbaumandMitchelKlein,Springer,2005第6次ABELtutorialYuriiAulchenko,2011参考书回归分析和相关分析生物统计学研究所张洪线性回归1.1回归直线1.2参数估计方法:最小二乘估计1.3参数推断:F-检验、t-检验、区间估计1.4回归模型的诊断:残差分析1.5多重线性回归1.6Box-Cox变换2.相关分析2.1Pearson相关系数2.2相关系数的统计推断:z-检验、区间估计2.3偏相关系数2.4秩相关与多重相关3实例分析与函数关系的区别:同一身高可以体

3、重不同,体重随身高增加的关系不是严格成立,只是有这种趋势总的趋势:随着身高增加,体重也跟着增加为什么?因为身高只能解释体重的一部分原因,还有其他未被考虑的因素,如饮食、地域、人种等线性回归目标:建立一个连续型因变量X(身高)与自变量Y(体重)之间的关系因变量自变量随机误差:未被身高解释的部分:饮食、种族、地域…截距斜率:(1)>0正相关(2)<0负相关(3)=0不相关X每增加一个单位,Y增加个单位均值为0:最简单的关系---线性关系:自变量和因变量的选择:由实际问题本身决定。问题:如何估计参数?X能解释Y的比例是多少?假设检验问题:线性模型是否适用?如果模型不适用,如何修正?1.1回归直

4、线量化X与Y的关系对于新的个体,如果知道与,可用X来预测Y。1.2参数估计方法:最小二乘估计(LeastSquares估计)观测值与预测值(蓝线)的误差观测值与预测值(黑线)的误差总体上看,蓝线比黑线拟合效果要好(从拟合误差看)两条回归直线观测值:残差:>fit=lm(weight~height,data=dat);>print(fit);Call:lm(formula=weight~height,data=dat)Coefficients:(Intercept)height-88.67740.8902最小二乘估计dat是一个dataframe,有两个变量:height和weightR中

5、线性模型拟合(2)最小一乘估计估计方法R代码输出的结果>print(fit$coef);Coefficients:(Intercept)x-88.67740.8902几个有用的函数:summary、names1.3参数推断预测值:总平方和SStot自由度=n-1回归平方和SSreg自由度=1残差平方和SSerr自由度=n-2回归平方和占总平方和的比重越大,则X能解释Y的部分越大!回归方程越好!>summary(fit)$r.squared[1]0.693347方差分解度量方法F检验适用条件:误差e1,…,en独立同分布,服从正态分布。>anova(fit)AnalysisofVarian

6、ceTableResponse:yDfSumSqMeanSqFvaluePr(>F)x1523.71523.7129.3930.0001168***Residuals13231.6317.82---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.自由度平方和平均平方FP-值如果误差独立同分布服从正态分布,则零假设成立时,F服从自由度为1和n-2的F分布方差分析表回归部分残差部分F统计量t检验:回归系数的显著性检验零假设:回归系数等于0>summary(fit)$coefEstimateStd.ErrortvaluePr(>

7、t

8、)(Intercep

9、t)-88.677425928.3051787-3.1329050.0079283231x0.89015530.16418845.4215480.0001167570参数估计标准差T统计量p-值零假设成立且误差独立同分布且服从正态分布时,T服从自由度为n-2的t分布tn-2适用条件:误差e独立同分布服从正态分布样本量不太小时,误差分布偏离正态分布不是很大时仍适用,即对正态性假设不是很敏感当样本量大时总是适用的,因为此时T依分布收敛于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。