数据特征的描述和分析统计学课件

数据特征的描述和分析统计学课件

ID:43968500

大小:12.48 MB

页数:75页

时间:2019-10-17

数据特征的描述和分析统计学课件_第1页
数据特征的描述和分析统计学课件_第2页
数据特征的描述和分析统计学课件_第3页
数据特征的描述和分析统计学课件_第4页
数据特征的描述和分析统计学课件_第5页
资源描述:

《数据特征的描述和分析统计学课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第4章数据的概括性度量作者:中国人民大学统计学院贾俊平PowerPoint统计学第4章数据的概括性度量4.1集中趋势的度量4.2离散程度的度量4.3偏态与峰态的度量学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合偏态与峰态的测度方法用Excel计算描述统计量并进行分析4.1集中趋势的度量4.1.1分类数据:众数4.1.2顺序数据:中位数和分位数4.1.3数值型数据:平均数4.1.4众数、中位数和平均数的比较集中趋势(ce

2、ntraltendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据分类数据:众数众数(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数(不惟一性)无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:25282

3、8364242分类数据的众数(例题分析)不同品牌饮料的频数分布饮料品牌频数比例百分比(%)果汁矿泉水绿茶其他碳酸饮料610118150.120.200.220.160.301220221630合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买碳酸饮料的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即Mo=碳酸饮料顺序数据的众数(例题分析)解:这里的数据为顺序数据。变量为“回答类别”甲城市中对住房表示不满意的户数最多,为108

4、户,因此众数为“不满意”这一类别,即Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意不满意一般满意非常满意24108934530836311510合计300100.0顺序数据:中位数和分位数中位数(median)排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即中位数(位置和数值的确定)位置确定数值确定顺序数据的中位数(例题分析)解:中位数的位置为(300+1)/2=1

5、50.5从累计频数看,中位数在“一般”这一组别中中位数为Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—数值型数据的中位数(9个数据的算例)【例】9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789中位数1080数值型数据的中位数(10个数据的算例)

6、【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910四分位数(quartile)排序后处于25%和75%位置上的值不受极端值的影响计算公式QLQMQU25%25%25%25%顺序数据的四分位数(例题分析)解:QL位置=(300)/4=75QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为QL=不满意QU=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户

7、)累计频数非常不满意不满意一般满意非常满意2410893453024132225270300合计300—数值型数据的四分位数(9个数据的算例)【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789数值型数据:平均数平均数(mean)也称为均值集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响有简单平均数和加权平均数之分

8、根据总体数据计算的,称为平均数,记为;根据样本数据计算的,称为样本平均数,记为xx简单平均数(Simplemean)设一组数据为:x1,x2,…,xn(总体数据xN)样本平均数总体平均数加权平均数(Weightedmean)设各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fk样本加权平均总体加权平均加权平均数(例题分析)某电脑公司销售量数据分组表按销售量分组

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。