《SPSS数据的预处理》PPT课件

《SPSS数据的预处理》PPT课件

ID:36699165

大小:1.48 MB

页数:76页

时间:2019-05-10

《SPSS数据的预处理》PPT课件_第1页
《SPSS数据的预处理》PPT课件_第2页
《SPSS数据的预处理》PPT课件_第3页
《SPSS数据的预处理》PPT课件_第4页
《SPSS数据的预处理》PPT课件_第5页
资源描述:

《《SPSS数据的预处理》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第三章SPSS数据的预处理为什么要进行数据的预处理在数据文件建立之后,通常还需要对分析的数据进行必要的预加工处理,这是数据分析过程中必不可少的一个关键步骤。数据的预加工处理服务于数据分析和建模,主要包括以下几个问题:数据的排序变量计算数据选取计数分类汇总数据分组数据预处理的其他功能:转置、加权、数据拆分、缺失值处理、数据排秩、定义变量集。预处理的内容3.1数据的排序SPSS的数据排序是将数据编辑窗口中的数据按照某个或多个指定变量的变量值升序或降序重新排列。这里的变量也称为排序变量。排序变量只有一个时,排序称为单值排序。排序变量有多个时,排序称为多重排序。多重排序中,第一个

2、指定的排序变量称为主排序变量,其他依次指定的变量分别称为第二排序变量、第三排序变量等。数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等;通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距,初步把握和比较数据的离散程度;通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产生重要影响提供帮助。3.1.1数据排序的作用SPSS数据排序的基本操作步骤(1)选择菜单Data-SortCases(2)将主排序变量从左边的列表中选到Sortby框中,并在SortOrder框中选择按该变量的升序还是降序排序。(3)如果是多重排序

3、,还要一次指定第二、第三排序变量及相应的排序规则。3.1.2数据排序的基本操作在左边的源变量框中选择排序变量进入Sortby框。如果选择2个以上的变量,观测量的排序结果与排序变量在Sortby框中的顺序有关。列于首位的为第一排序变量。在SortOrder栏内选择排序方式——升序与降序1、数据排序是整行数据排序,而不是只对某列变量排序;2、多重排序中指定排序变量的次序很关键。先指定的变量优先于后指定的变量。多重排序可以在按某个变量值升序(或降序)排序的同时再按其他变量值降序(或升序)排序;3、数据排序后,原有数据的排序次序必然被打乱,排序后不能撤销。说明数据排序应用举例利用

4、居民储蓄调查数据,通过数据排序功能分别找到城镇户口和农村户口储户一次存款金额的最大值和最小值3.2变量计算数据的转换处理是在原有数据的基础上,计算产生一些含有更丰富信息的新数据。例如根据职工的基本工资、失业保险、奖金等数据,计算实际月收入,这些新变量具有更直观更有效的特点。3.2.1变量计算的目的SPSS变量计算是在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量。(1)变量计算是针对所有个案(或指定的部分个案)的,每个个案都有自己的计算结果。(2)变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计

5、算结果的数据类型相一致。在变量计算过程中涉及到几个概念:SPSS算数表达式、SPSS条件表达式和SPSS函数。指出按照什么方法计算变量;SPSS算术表达式(NumericExpression)是由常量、变量、算术运算符、圆括号、函数等组成的式子。字符型常量应当用引号括起来变量是指那些已存在于数据编辑窗口中的原有变量算术运算符主要包括+、-、*、/、**(乘方)在同一算术表达式中的常量及变量,数据类型应该一致,否则无法计算3.2.2SPSS算术表达式在变量计算中通常要求对不同的个案分别按照不同的方法进行计算,于是就需要通过一定的方式来指定个案;SPSS条件表达式是一个对条件

6、进行判断的式子。其结果有两种取值:如果判断条件成立,则结果为真;如果判断条件不成立,则结果为假。条件表达式包括简单条件表达式和复合条件表达式。3.2.3SPSS条件表达式(1)简单条件表达式由关系运算符、常量、变量以及算术表达式等组成的式子。其中关系运算符包括>、<、=、~=(不等于)、>=、<=。(nl<35)(2)复合条件表达式又称逻辑表达式,是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。其中,逻辑运算符号包括&或AND(并且)、

7、或OR(或者)、~或NOT(非)。NOT的运算优先级最高,其次是AND,最低是OR。可以通过圆括号改变运算的优先级。(年龄<=35

8、)andnot(职称<3)SPSS函数是事先编好并存储在SPSS软件中,能够实现某些特定计算任务的一段计算机程序。这些程序都有各自的名字称为函数名。执行这些程序段得到的计算结果称为函数值。函数书写的具体形式为:函数名(参数)3.2.4SPSS函数其中,函数名是SPSS已经规定好的,参数可以是常量(字符型常量应用引号括起来),也可以是变量或算术表达式。参数可能是一个,也可能是多个,各参数之间用逗号分隔。SPSS函数大致可以分成八大类:算术函数、统计函数、分布函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数。(1)选择菜

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。