R语言方法总结

R语言方法总结

ID:39588988

大小:360.01 KB

页数:14页

时间:2019-07-06

R语言方法总结_第1页
R语言方法总结_第2页
R语言方法总结_第3页
R语言方法总结_第4页
R语言方法总结_第5页
资源描述:

《R语言方法总结》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、计算描述性统计量:1、summary():例:summary(mtcars[vars])summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。2、apply()函数或sapply()函数计算所选择的任意描述性统计量。mean、sd、var、min、max、median、length、range和quantile。函数fivenum()可返回图基五数总括(Tukey’sfive-numbersummary,即最小值、下四分位数、中位数、上四分位数和最大值)。sapply()例:mystats<-funct

2、ion(x,na.omit=FALSE){if(na.omit)x<-x[!is.na(x)]m<-mean(x)n<-length(x)s<-sd(x)skew<-sum((x-m)^3/s^3)/nkurt<-sum((x-m)^4/s^4)/n-3return(c(n=n,mean=m,stdev=s,skew=skew,kurtosis=kurt))}sapply(mtcars[vars],mystats)3、describe():Hmisc包:返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值。例:libr

3、ary(Hmisc)describe(mtcars[vars])4、stat.desc():pastecs包若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。若norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果。这里使用了p值来计算平均数的置信区间(默认置信度为0.95:例:libr

4、ary(pastecs)stat.desc(mtcars[vars])5、describe():psych包计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误例:library(psych)describe(mtcars[vars])分组计算描述性统计量1、aggregate():例:aggregate(mtcars[vars],by=list(am=mtcars$am),mean)2、by():例:dstats<-function(x)(c(mean=mean(x),sd=sd(x)))by

5、(mtcars[vars],mtcars$am,dstats)by(mtcars[,vars],mtcars$am,plyr::colwis(dstats))3、summaryBy():doBy包例library(doBy)summaryBy(mpg+hp+wt~am,data=mtcars,FUN=mystats)4、describe.by():doBy包(describe.by()函数不允许指定任意函数,)例:library(psych)describe.by(mtcars[vars],mtcars$am)5、reshape包分组:(重铸和融合)例:l

6、ibrary(reshape)dstats<-function(x)(c(n=length(x),mean=mean(x),sd=sd(x)))dfm<-melt(mtcars,measure.vars=c("mpg","hp","wt"),id.vars=c("am","cyl"))cast(dfm,am+cyl+variable~.,dstats)频数表和列联表1、table():生成简单的频数统计表mytable<-with(Arthritis,table(Improved))Mytable2、prop.table():频数转化为比例值prop.ta

7、ble(mytable)3、prop.table()*100:转化为百分比prop.table(mytable)*100二维列联表4、table(A,B)/xtabs(~A+b,data=mydata)例:mytable<-xtabs(~Treatment+Improved,data=Arthritis)5、margin.table()和prop.table():函数分别生成边际频数和比例(1:行,2:列)行和与行比例margin.table(mytable,1)prop.table(mytable,1)列和与列比例margin.table(mytable

8、,2)prop.table(mytable,2)prop.tabl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。