连续变量的统计描述与参数估计

连续变量的统计描述与参数估计

ID:46979034

大小:266.16 KB

页数:18页

时间:2019-12-02

连续变量的统计描述与参数估计_第1页
连续变量的统计描述与参数估计_第2页
连续变量的统计描述与参数估计_第3页
连续变量的统计描述与参数估计_第4页
连续变量的统计描述与参数估计_第5页
资源描述:

《连续变量的统计描述与参数估计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章连续变量的统计描述与参数估计石彤2013.10统计分析的目的是研究总体特征;统计方法分为描述性统计分析和推断性统计分析:描述性统计分析——对数据进行描述的统计方法;推断性统计分析——从样本信息回推总体特征的统计方法。各种统计描述指标(统计量,summarystatistic),也称汇总统计量或概括统计量,用少量数据概括大量数据的技术。针对不同测量类型的变量,有不同的描述指标体系和统计图形与之对应。分类变量的描述统计量,如频数、频率;连续变量的描述统计量,如均数、标准差。5.1连续变量的统计描述指标体系统计指标:集中趋势离散趋势分布特征其他趋势图5.1CCSS数据中S3绘制的直

2、方图5.1.1集中趋势的描述指标集中趋势(CentralTendency),又称“位置统计量”(LocationStatistic),即数据分布的中心位置的统计量,包括算术均数、中位数、众数、截尾均数。截尾均数:由于均数较易受极端值的影响,因此可以考虑将数据进行排序后,按照一定比例去掉最两端的数据,包括中部的数据来求均数。如果截尾均数和原均数相差不大,则说明数据不存在极端值,或者两侧极端值的影响正好抵消。常用的截尾均数有5%截尾均数,即两端各去掉5%的数据。在SPSS中“探索”(Explore)过程可以自动计算5%截尾均数。5.1.2离散趋势的描述指标离散趋势(Dispersion

3、Tendency),又称“尺度统计量”(ScaleStatistic),即可以反映数据波动范围的大小的统计量,包括全距、方差、标准差、百分位数、四分位数、四分位间距、变异系数。变异系数:当需要比较两组数据离散程度大小的时候,往往直接使用标准差来进行比较并不合适。这可以被分为两种情况:一是测量尺度相差太大;二是数据量纲不同。变异系数(coefficientofvariation,简称CV)可以消除测量尺度和量纲的影响。它是标准差与其平均数的比率。计算出的变异系数没有量纲,同时又按照其均数大小进行了标化,这样就可以进行客观的比较。5.1.3分布特征、其他趋势的描述指标分布特征(Dist

4、ributionTendency),又称“形态统计量”,即描述数据偏离分布程度的统计量,包括偏度、峰度。其他趋势,是统计描述的其他指标,包括单峰或双峰分布、M统计量、极端值列表等。5.1.4SPSS中的相应功能用于连续变量统计描述的过程,均集中在“描述统计”(DescriptiveStatistics)子菜单中:1.频率过程(Frequencies)该过程特色是产生原始数据的频数表,并能计算各种百分位数,描述指标包括集中趋势、离散趋势、百分位数和分布指标四部分,能绘制统计图。2.描述过程(Descriptives)该过程适用于对服从正态分布的连续性变量进行描述,它不能绘制统计图、所

5、能计算的统计量较少,使用频率很高。3.探索过程(Explore)该过程用于对连续变量分布状况不清楚的探索性分析,可计算许多描述性统计量(如均数、百分位数、截尾均数、极端值列表),绘制统计图和参数估计;4.比率过程(Ratio)该过程用于对两个连续变量计算相对比指标,可计算专业的相对比描述指标。5.2连续变量的参数估计指标体系5.2.1正态分布1.正态分布的定义2.标准正态分布5.2.2参数的点估计1.矩法2.极大似然法3.稳健估计值M估计、R估计5.2.3参数的区间估计1.标准误样本均数的标准差,称均数标准误,或称标准误差。2.区间估计的计算可信度或置信度(1-α);可信区间或置信

6、区间;显著度或显著性水平(α)。5.2.4SPSS中的相应功能SPSS的许多过程均可完成连续变量参数估计的任务,针对性较强的是描述统计子菜单中的过程:1.描述过程将原变量转换为标准正态分布的得分,选择“将标准化得分另存为变量”复选框。2.探索过程可计算标准误,还可以直接给出均数95%可信区间,以及提供稳健估计值。3.P-P图和Q-Q图用图形方式直接观察样本数据分布是否服从所假设的理论分布,如正态分布。5.3案例:信心指数的统计描述5.3.1使用频率过程进行分析例5.1对CCSS数据中的消费者信心总值数index1、现状指数index1a和预期指数index1b进行统计描述,并计算出

7、95%个体参考值范围。1.界面说明2.操作说明与结果解释5.3.2使用描述过程进行分析1.界面说明2.操作说明与结果解释5.3.3使用探索过程进行分析例5.2分月份对总指数index1进行描述1.界面说明2.基本输出结果3.M-统计量4.极端值列表5.百分位数5.4Bootstrap方法5.4.1模型1.基本原理2.参数法和非参数法3.抽样次数的确定5.4.2案例:对总指数进行Bootstrap估计例5.3对总指数的均数、标准差进行Bootstrap方法的参数点估计和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。