algae(海藻)例子

algae(海藻)例子

ID:36322470

大小:658.00 KB

页数:80页

时间:2019-05-09

algae(海藻)例子_第1页
algae(海藻)例子_第2页
algae(海藻)例子_第3页
algae(海藻)例子_第4页
algae(海藻)例子_第5页
资源描述:

《algae(海藻)例子》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Algae(海藻)例子algaetrain<-read.table('f:/讲课/SJM/Analysis.txt',header=T,dec='.',na.strings=c('XXXXXXX'))1algaetrain<-read.table('f:/讲课/SJM/Analysis.txt',header=T,dec='.',na.strings=c('XXXXXXX'))algaetest1<-read.table('f:/讲课/SJM/Testdata.txt',header=T,dec='.'

2、,na.strings=c('XXXXXXX'))algaetest2<-read.table('f:/讲课/SJM/Solutions.txt',header=T,dec='.',na.strings=c('XXXXXXX'))algaetest<-cbind(algaetest1,algaetest2)algae<-rbind(algaetrain,algaetest)summary(algae)##对algae数据集的基本信息特征的描述2par(mfrow=c(1,2))hist(algae$mx

3、PH,prob=T)hist(algae$mxPH,prob=T,xlab='',main='HistogramofMaximumPHvalue',ylim=0:1)lines(density(algae$mxPH,na.rm=T))#在直方图中添加密度线rug(jitter(algae$mxPH))#画出变量mxPH在X轴附近的真实值34library(lattice)bwplot(size~a1,data=algae,ylab='RiverSize',xlab='AlgaA1')#5缺失值的处理(以

4、对训练集algaetrain的缺失值处理为例)6algaetrain[!complete.cases(algaetrain),]##显示algaetrain数据集中含有缺失值项nrow(algaetrain[!complete.cases(algaetrain),])##缺失值项的总行数7方法1:直接将含有缺失值项的水样删除algaetrain1<-na.omit(algaetrain)8方法2:运用常用的均值和中位数的方法进行插补9algaetrain2mean<-algaetrainfor(rinw

5、hich(!complete.cases(algaetrain)))algaetrain2mean[r,which(is.na(algaetrain[r,]))]<-apply(data.frame(algaetrain[,which(is.na(algaetrain[r,]))]),2,mean,na.rm=T)##对含有缺失值的记录用均值进行插补algaetrain2median<-algaetrainfor(rinwhich(!complete.cases(algaetrain)))algaetr

6、ain2median[r,which(is.na(algaetrain[r,]))]<-apply(data.frame(algaetrain[,which(is.na(algaetrain[r,]))]),2,median,na.rm=T)##对含有缺失值的记录用中位数进行插补10通过对含缺失值项的变量同其他变量的相关性的大小建立回归方程来插补11cor(algaetrain[,4:18],use="complete.obs")#变量间的相关性,计算时不考虑缺失值symnum(cor(algaetra

7、in[,4:18],use="complete.obs"))#简单明显示出变量间的相关1213从变量之间的相关程度图中,我们可以发现绝大部分变量之间相关程度不高,但变量NH4和NO3、变量PO4、oPO4之间相关程度很大,尤其是变量PO4、oPO4之间相关程度达到91.2%。由于数据集algaetrain中第62条和第199条含有的缺失项过多,我们可以考虑将其从数据集中直接删除,而变量NH4和NO3的缺失值集中在数据集algaetrain中第62条和第199条中,故不需要再考虑对其插补。下面来考虑对变量

8、PO4、oPO4建立回归方程来对缺失值进行插补。algaetrain3l<-lm(oPO4~PO4,data=algaetrain)##对变量PO4、oPO4建立回归方程summary(algaetrain3l)##建立函数fillPO4,对缺失项进行回归插补14fillPO4<-function(oP){if(is.na(oP))return(NA)elsereturn((oP+15.6142)/0.6466)}algaetrain3<-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。