统计分析方法的选择

统计分析方法的选择

ID:5857011

大小:2.94 MB

页数:72页

时间:2017-12-14

统计分析方法的选择_第1页
统计分析方法的选择_第2页
统计分析方法的选择_第3页
统计分析方法的选择_第4页
统计分析方法的选择_第5页
资源描述:

《统计分析方法的选择》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据分析中数理统计方法的选择尤圣富上海中医药大学附属龙华医院临床流行病学教研组2011-10-13数理统计问题的重要性在科学研究中,经常会涉及到对随机变量大小、离散及分布特征的描述以及对2个或多个随机变量之间的关系描述问题。对随机变量及随机变量之间的关系进行定量描述的数学工具就是数理统计学。在科学研究中,能否正确使用各种数理统计方法关系到所得出结论的客观性和可信性。目前,国内科技期刊对稿件中数理统计方法问题的重视程度存在差异。1统计软件的选择统计分析通常涉及大量的数据,需要较大的计算工作量。在进行统计分析时,尽管作者可

2、以自行编写计算程序,但在统计软件很普及的今天,这样做是毫无必要的。出于对工作效率以及对算法的通用性、可比性的考虑,一些学术期刊要求作者采用专门的数理统计软件进行统计分析。1统计软件的选择问题:作者未使用专门的数理统计软件,而采用Excel这样的电子表格软件进行数据统计分析。由于电子表格软件提供的统计分析功能十分有限,只能借助它进行较为简单的统计分析,故我们不主张作者采用这样的软件进行统计分析。1统计软件的选择目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名有SPSS(StatisticalPackagef

3、orSocialSciences)和SAS(StatisticalAnalysisSystem)。此外,还有STATA和BMDP等……。SPSS是专门为社会科学领域的研究者设计的,但此软件在自然科学领域也得到广泛应用。Stata和SAS、SPSS一起被并称为新的三大权威统计软件,WHO的研究人员也把Stata作为最主要的统计分析工作软件2.1均值的计算:理论问题1)均值(准确的称呼应为“样本均值”)的统计学意义:反映随机变量样本的大小特征。2)均值对应于随机变量总体的数学期望—总体的数学期望客观上决定着样本的均值,反过

4、来,通过计算样本的均值可以描述总体的数学期望。2.1均值计算:理论问题(续)3)在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值进行统计处理的问题。4)为找到代表这些观测值总体大小特征的代表值(统计量,该统计量根据样本数据算出),多数作者会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨的——不一定总是正确的2.2均值计算:技术问题在数理统计学中,作为描述随机变量样本的总体大小特征的统计量有算术平均值、几何平均值和中位数等多个。何时用算术平均值?何时用几何平均值?以

5、及何时用中位数?这不能由研究者根据主观意愿随意确定,而要根据随机变量的分布特征确定。2.2均值计算:技术问题(续)反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布时,其数学期望就可以用样本的算术平均值描述。此时,可用样本的算术平均值描述随机变量的大小特征。如果所研究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下,可通过假设检验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,则几何平均值就是数学期望的值。此时,就可以计算变量的几何平均值。如果随机变量既

6、不服从正态分布也不服从对数正态分布,校正无效,则应该采用非参数检验。2.3参数统计和非参数统计优缺点参数统计优点:对资料的分析利用充分统计分析的效率高缺点:对资料的要求高适用范围有限非参数统计优点:对资料的没有特殊要求不受分布的影响(偏态、分布不明的资料)不受方差齐性的限制不受变量类型的影响不受样本量的影响缺点:检验效率低(易犯Ⅱ型错误)对信息的利用不充分。3相关分析在相关分析的前提是需要作出散点图。常犯的错误是:简单地计算Pearson积矩相关系数,而且既不给出正态分布检验结果,也往往不明

7、确指出所计算的相关系数就是Pearson积矩相关系数。在数理统计学中,除有针对数值变量设计的Pearson积矩相关系数(对应于“参数方法”)外,还有针对顺序变量(即“秩变量”)设计的Spearman秩相关系数和Kendall秩相关系数(对应于“非参数方法”)等。Pearson积矩相关系数可用于描述2个随机变量的线性相关程度,Spearman或Kendall秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势。3相关分析:相关系数的选择在相关分析中,计算各种相关系数是有前提条件的。在相关分析中,对于秩变量

8、,一般别无选择,只能计算Spearman或Kendall秩相关系数。对于数值变量,只要条件许可,应尽量使用检验功效最高的参数方法,即计算用Pearson积矩相关系数。只有计算Pearson积矩相关系数的前提不存在时,才考虑退而求其次,计算专门为秩变量设计的Spearman或Kendall秩相关系数(尽管这样做会导致检验功效的降低)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。