sas软件应用的几点经验new

sas软件应用的几点经验new

ID:34520756

大小:165.90 KB

页数:4页

时间:2019-03-07

sas软件应用的几点经验new_第1页
sas软件应用的几点经验new_第2页
sas软件应用的几点经验new_第3页
sas软件应用的几点经验new_第4页
资源描述:

《sas软件应用的几点经验new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1997年第3期           统计与信息论坛           1997年9月25日SAS软件应用的几点经验朱 钰摘 要 文章参考了一些统计著作,并结合笔者的实际应用心得,就SAS统计软件的应用谈了自己的看法。关键词 SAS软件 比例风险回归 方差分析 广义逆矩阵 误差 平方和在统计发展的过程中,统计计算经历了不同的阶段,由单独的手工计算到使用各种各样的计算器作为辅助计算手段的阶段,再到现在以计算机为主要手段的统计计算阶段。在统计计算发展的不同阶段中,统计计算与统计方法的关系也各有不同。在手工统计计算阶段,统计计算直接与统计方法相联系,不懂统计方法便无法实现统计运算;在使用各种各

2、样的计算器(无论是机械的还是电子的)的阶段,这些计算手段的作用只是加快了计算的速度,统计计算与统计方法之间的关系并没有受到影响;在以作为计算手段的现阶段,统计计算与统计方法之间的关系产生了巨大的变化。这种变化源于统计软件包的发明和使用。统计软件包是将各种统计计算过程所编成的便于使用的程序。有些程序太简单、太方便了,以至操作者不需要理解统计方法也可以完成统计计算。这就带来了统计方法以及相应的统计计算结果被误用及滥用的危险性。消除这种危险性的一种途径就是对各种统计软件包的深入了解与掌握,也就是说,关于统计软件包的学习与研究,应该是当前统计方法的使用者普遍重视的问题,应该把对已有的普遍应用的统计

3、软件的应用研究看作和统计方法的学习同样的重要。目前,国内关于国际流行的统计软件的介绍往往有过于简略的倾向。这种倾向对于上述的危险性起着不良的作用。对于统计软件的使用,首先应该熟读该软件的使用说明或手册,弄清楚该软件的编写特点,以及在处理具体的问题时该软件采用的是哪一家的理论,然后才能运行该软件,并对输出结果进行分析。在对一个软件多次使用之后,逐渐找出该软件的弱点,并采取相应的补救办法,达到对该软件灵活使用或高级运用。以下拟就本人使用SAS统计软件的几点经验,以实际应用较多的方差分析方法为主对以上观点略作说明。一、在使用SAS软件的PHREG(比例风险回归)时,使用者常常需要检验交互影响项,

4、但是,PHREG程序本身没有提供合适的程序(语句)来创建能够检验交互影响项的设计矩阵。收稿日期:1997—01—13—54—©1995-2005TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved.面对这样的情况有些使用者也许会想到通过DATA过程来创建能够检验交互影响项的设计矩阵,如果考虑的是A、B两个变量的交互影响,又假如A有p个水平,B有q个水平,就要创建p-1个A,q-1个B,(p-1)(q-1)个AB项,其工作量将是很大的。但是如果用GLMMOD(一般回归模型)程序来完成此项任务,仅用一、两个语句就可以做到这一点,得到所需要的设

5、计矩阵,然后再回到PHREG程序,继续进行分析。这样做的结果,实际上是提高了PHREG程序的功能。二、当进行单因素方差分析时,分析者往往会因变量在影响因素各水平上的平均数之间的差异感兴趣,这时所使用的模型是过度参数化的(Overparametrized)模型,这种模型的设计矩阵不是满秩的,对这种不满秩的设计矩阵往往不能计算逆矩阵,而只能计算广义逆,计算广义逆的途径往往又不止一个,例如,假定A是一个方阵,其秩为r,并可被分块如下:A11A12A=A21A22--其中A11是秩为r的满秩矩阵,那么等式AAA=A(A是广义逆)的解便为:A110-A=00如果将前述的设计矩阵看做A,并设影响因素有

6、4个水平,最终得到的回归参数向量的解便是:vY4.vvY1.-Y4.dvvB=Y2.-Y4.vvY3.-Y4.vvY4.-Y4.  这就是SAS中的GLM程序中的Solution选项所采用的计算方法。而其它的计算广义逆的方法因为无法与所需的、规范的假设问题相联系,而没有被SAS的GLM程序的Solution选项所采纳。这个细节问题以及与此相类似的其它许多细节问题在使用SAS以及其它统计软件时都要引起高度的注意或重视。三、双向不平衡数据方差分析模型中的第一至第三类平方和。在用SAS程序进行方差分析时,首先应该认识到,不管你所输入的数据中各因素的各水平是按什么顺序排列的,SAS的GLM程序输出

7、结果都是按各水平名字的英文字母顺序排列的,如果忽视了这一点,就会在将方差分析模型转化为回归模型并进行两个模型的比较时出错,张冠李戴,将一因素的影响说成是另一因素的影响。按英文字母顺序排列这种情况不仅仅出现在这一种场合,因此,要格外注意SAS的输出结果,小心从事,认真对待。在分析或解释输出结果时,SAS的GLM程序输出结果中都含有第一至第三类平方和,在平衡数据的情况下:第一类平方和=第二类平方和=第三类平方和在不平衡数据的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。