SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt

SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt

ID:58641615

大小:2.49 MB

页数:160页

时间:2020-10-12

SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt_第1页
SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt_第2页
SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt_第3页
SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt_第4页
SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt_第5页
资源描述:

《SPSS_13.0for_Windows在医学科研统计中的应用课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、SPSS13.0forWindows在医学科研统计中的应用平凉医学高等专科学校预防医学教研室数据处理的一般原则医学数据的统计处理涉及到医学专业知识、统计专业知识、处理数据的经验和技巧等各个方面,是一门很高超的艺术。在数据处理过程中,原始数据的采集和录入,数据的管理,恰当选用统计方法,熟练使用统计软件等,都是必须重视的关键环节。原始数据的记录形式医学研究的原始数据常列成类似表25-1的二维结构,即行与列结构的数据集形式。在表25-1中,每一行称为一个记录(record),或一个观察单位(case);每一列称为一个变量(variable),用以表示变量、项目或观察指标等。表25-1记录的原

2、始数据是一个由274例观察单位和11个变量组成的数据集。表25-1肾衰病人预后研究的临床资料记录病人编号1234┆274病案号004757007950011093017555┆279183性别男女男男┆女年龄26315525┆88生理评分1413179┆15肾毒性无无无无┆有黄疸有无无无┆无昏迷无无无无┆无肌酐5205232091303┆331胆固醇-4.53.34.1┆6.1肾功能预后治愈治愈治愈治愈┆丧失原始数据的记录形式原始数据中,变量分为标识变量和分析变量两种。标识变量主要用于数据管理,包括数据的核对与增删等,是研究记录中不可缺少的内容,如表25-1中的“病人编号”和“病案号”

3、即为标识变量。分析变量则是数据分析的主要内容,表25-1中除上述2个标识变量外,其它9个变量均为分析变量。分析变量又被分为反应变量(responsevariable)和解释变量(explanatoryvariable)。反应变量是表示试验效应或观察结果大小的变量或指标。解释变量又称指示变量(indicator)、分组变量(groupingvariable)、分类变量(categoricalvariable)、协变量等。根据研究目的以及变量间的相互关系,各变量的作用并非一成不变。原始数据的录入在进行统计分析前,原始数据需录入计算机。录入的文件类型大致有:数据库文件,如dBASE、FoxB

4、ASE、Lotus、EPIinfo等;Excel文件;文本文件,如word文件、WPS文件等;统计应用软件的相应文件,如SPSS数据文件、SAS数据文件、STATA数据文件等。目前,上述文件类型绝大多数都可以相互转换。录入数据时,应遵循便于录入,便于核查,便于转换,便于分析的原则。便于录入是指尽可能地减少录入工作量,例如,下图是表25-1原始数据录入为SPSS数据文件(CH25-1.sav)的形式,录入时,用数值变量取代了字符变量(如图中的“性别”,“肾毒性”,“黄疸”,“昏迷”),可以大大节约录入的时间和费用。(如将性别标记为1=“男”,0=“女”)。原始数据的录入数据处理中的几个基

5、本问题1.数据核查数据录入后,首先须对录入的数据进行核查,以确保录入数据的准确性和真实性。核查准确性可分两步进行。第一步逻辑检查,通过运行统计软件中的基本统计量过程,列出每个变量的最大和最小值,如果某变量的最大或最小值不符合逻辑,则数据有误。例如,在SPSS数据文件中,当变量“年龄”的最大值为“300”时,一定有误。利用软件的查找功能可立即找到该数据,然后根据该数据对应的标识值找出原始记录,更正该数据。如本例可查到该数据对应的“病人编号”为“27”,查原始记录的年龄为“30”。第二步数据核对,将原始数据与录入的数据一一核对,错者更正。有时,为慎重起见,采用双份录入的方式,然后用程序作一

6、一比较,不一致者一定是录错的数据。数据核查的另一项任务是对数据的真实性做出初步判断。数据处理中的几个基本问题2.离群数据的处理当个别数据与群体数据严重偏离时,被称为离群数据(outlier)或极端数据(extremevalue)。统计软件一般都有判断离群数据的方法。判断离群数据有多种方法,例如,SPSS软件对其的定义为:观察值距箱式图(boxplot)的箱体底线(第25百分位数)或顶线(第75百分位数)的距离为箱体高度(四分位数间距)的1.5倍至3倍时被视为离群点;观察值距箱体底线或顶线的距离超过3倍的箱体高度时被视为极端值。若有离群数据出现,可分为两种情况处理:一种是,如果确认数据有

7、逻辑错误,又无法纠正,可直接删除该数据。例如,若某一数据中某病例的身高变量为“1755”cm,且原始记录亦如此,又无法再找到该病例时,显然这是一个错误的记录,只能删除。另一种是,若数据并无明显的逻辑错误,可将该数据剔除前后各做一次分析,若结果不矛盾,则不剔除;若结果矛盾,并需要剔除,必须给以充分合理的解释,例如用何种方法确定偏离数据,该数据在实验中何种干扰下产生等。数据处理中的几个基本问题3.统计方法前提条件的检验:应用参数方法进行假设检验往往

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。