统计学基础知识培训.ppt

统计学基础知识培训.ppt

ID:59605754

大小:196.00 KB

页数:44页

时间:2020-11-15

统计学基础知识培训.ppt_第1页
统计学基础知识培训.ppt_第2页
统计学基础知识培训.ppt_第3页
统计学基础知识培训.ppt_第4页
统计学基础知识培训.ppt_第5页
资源描述:

《统计学基础知识培训.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、统计学基础知识培训2007年5月根据测量尺度数据的分类姓名性别级别年龄绩效分数月均收入甲乙丙丁戊戌1101100001122125262725318.67.89.27.98.98.4247923452547268927763124注:1.本表纯属虚构,如有雷同实属巧合;2.性别栏0代表男,1代表女;级别栏0代表员工,1代表领班,2代表主管;3.绩效栏10分为满分。1999年某公司员工情况明细表数据的分类•根据数据测量的尺度:分为定类数据、定序数据、定距数据、定比数据•根据描述对象与时间的关系:分为截面数据和时间序列数据•根据统计数据的收

2、集方法:分为观测数据和实验数据你想要干什么?一.归纳、描述或者显示数据二.观察变量和数据的分布三.比较组间数据的不同四.变量之间显著性关系的测度五.相似数据分组的测度六.相似变量的压缩测度结束4你要归纳整理的是什么类型的数据?1.已分类数据(定类、定序)2.连续、数值型数据(定距、定比)返回你想如何归纳整理数据?1.分类计算频数和百分比2.计算两分类变量下的频数和百分比3.计算比率值:比率是各不同类别数值之间的比值返回分类变量的图形及图表显示员工级别频数百分(%)累积百分比(%)员工领班主管经理助理75158275%15%8%2%75.

3、00%90.00%98.00%100%合计100100%——Analyze——DescriptiveStatistics——Frequencies返回两分类变量数据的图表及图形显示员工级别<30岁30-39岁40-49岁49-50岁合计员工领班主管经理助理4772——205216231211——751582合计5628124100Analyze——DescriptiveStatistics——Crosstabs返回比率值的计算及显示Analyze——Reports——Casesummaries员工级别<30岁30-39岁40-49岁49

4、-50岁<40岁在本级别中的比率合计员工领班主管经理助理4772——205216231211——89.33%80%50%50%751582合计562812484%100返回如何整理连续数值型数据?1.描述连续数值型数据的统计量及数据分组法2.图表显示返回连续数值型数据统计量及数据分组法1.统计量:度量集中趋势的统计量包括平均数、几何平均;度量离散趋势的统计量包括极差、方差和标准差等。3.数据分组:分组是根据统计分析的需要,将原始数据按照某种标准划分成不同的组别,形成分组数据,分组后计算数据出现的频数,形成频数分布表。各常用统计量的计算方

5、法平均值(mean):一组数据之和除以数据个数;几何平均值:用于计算比率的平均,实际应用中,主要用于社会经济现象的年平均增长率;极差(Range):也称全距,是一组数据的最大值和最小值之差;方差:各变量与其均值离差平方的平均数;标准差(std.Deviation):即是方差的平方根;与方差不同的是,标准差具有与变量值一样的量纲,实际的意义要比方差清楚。SPSS实现:Analyze—DescriptiveStatistics—Descriptives数据分组法数据分组包括单变量分组和组距分组两种,单变量适合离散变量分组,一般数据都使用组距

6、分组。数据分组的步骤:1.确定组数,可以按斯特奇斯(Sturges)提出的经验公式来确定组数K;K=1+lgn/lg2。n为数据的个数,对结果四舍五入即为组数;2.确定各组的组距。组距是上限与下限的差,组距=(最大值-最小值)/组数;3.根据分组整理成频数分布表。分组需要“不重不漏”,因此习惯上规定“上组限不在内”。若有的值过大,可以设置开口组。等距分组由于各组的组距相等,各组频数分布不受组距大小的影响,可以从频数分布中直接观察频数分布的特征和规律,而不等距分组就必须计算频数密度,频数密度=频数/组距,频数密度才能准确反映频数分布的实际

7、情况。返回连续数值型数据的显示方法分组数据的图形显示——直方图这是406例汽车的马力的直方图50100150200汽车马力0204060频数未分组数据的显示方法——箱线图箱线图是由一组数据的5个特征值绘制而成的,它由一个箱子和两条线段组成,5个特征值为:最大值、最小值、中位数和两个四分位,下面是406例产地为美国、欧洲和日本三个地区的汽车马力值的箱线图。欧洲箱线图有两个离群点。连续数值型数据的显示方法返回你有何种数据?1.分类数据(定类、定序)2.连续数值型数据(定距、定比)返回分类数据分布的统计量指标1.集中趋势:计算众数、中位数众数

8、是一组数据中出现次数最多的变量值;中位数是一组数据排序后,处于中间位置的变量值;2.离散趋势:异众比率、四分位差异众比率是指非众数组的频数占总频数的比率,用Vr表示,Vr=(Σfi-fm)/Σfi。四分位差

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。