R语言基础知识.docx

R语言基础知识.docx

ID:62729368

大小:15.95 KB

页数:12页

时间:2021-05-19

R语言基础知识.docx_第1页
R语言基础知识.docx_第2页
R语言基础知识.docx_第3页
R语言基础知识.docx_第4页
R语言基础知识.docx_第5页
资源描述:

《R语言基础知识.docx》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、R语言基础知识在做数据处理的时候我们经常会碰到数据合并的问题,比如将两个或者多个相同行数的数据框合并起来(cbind)、将两个或多个等长的向量合并起来(cbind)、或者将不等长的数据框按照某一列合并起来(merge、join)。下面给大家一一介绍一下这几个函数的用法,并且我们还会在后面附带上Linux中如何用shell这把瑞士军刀来达到R中数据列合并的效果:1、等长数据框和向量的合并1.1cbind函数如果要直接横向合并两个矩阵或数据框,并且不需要指定一个公共索引,那么可以直接使用cbind()

2、函数。这个函数将横向合并对象A和对象B。为了让它正常工作,每个对象必须拥有相同的行数,且要以相同顺序排序。cbind(object1,object2,…#按列合并对象例:>rosterIDStudent11John22Angela13David24Joel35Mary>scoreMathScienceEnglish1502952526009922341280184625821555228920>roster_cbindroster_cbindIDStudentMathScienceEnglish1

3、1John502952522Angela600992233David412801844Joel625821555Mary5228920如果需要纵向合并两个数据框(数据集)请使用rbind()函数在使用rbind()函数时,两个数据框必须拥有相同的变量,不过它们的顺序不必一定相同。如果dataframeA中拥有dataframeB中没有的变量,在合并它们之前需做以下处理:(1)删除dataframeA中的多余变量;⑵在dataframeB中创建追加的变量并将其值设为NA(缺失)。纵向合并数据通常用于

4、向数据框中添加观测。2、按列合并当两个数据框通过一个或者多个共有变量进行联接时(即一种内联结,innerjoin),我们可以使用merge函数,也可以使用plyr包的join函数。join函数运行速度比merge函数快,数据较大时用join()函数合并数据会节约不少时间。2.1merge函数以数据框例:totalIDtotal_studentIDnamescore11Jim8922Tony2233Lisa7844Tom78dataframe的填充默认按列填充;merge()函数较我们之前介绍的cb

5、ind()和rbind()两个函数更加”智能”。2.2join函数join()函数是plyr包的一个辅助函数。大家在使用前需要先安装plyr包(install.package("plyr"))。plyr包遵循三位一体的Split-Apply-Combine(拆分数据,应用函数,组合结果)思想,设置了超过50个函数来应对各类型数据和处理的情况,使数据处理变得极为简单方便,极大地提高了数据处理的效率。join()函数的一般使用格式为:join(x,y,by=NULL,type="left",match

6、="all")作用:联合两个数据框参数:x,y是两个数据框;by是指定要联合的变量,默认值为所有的变量;type是指定联合的方式例:>x1join(x,y,by="x2")#若不指定联合的变量会按默认按共同的变量连接x1x2y1115NA2263033740448NA>join(x,y,by="x2",type="inner")#type="inner"表示只是把匹配的情况的列出来x1x2y11263023740>join(x,y,by="x2",type="right")#type="right

7、"表示右连接,y中数据全部显示,x中x2中没有1和2,以NA表示。join()函数中,type的默认值是左连接type="left"。x2x1y111NA1022NA203623047340>join(x,y,by="x2",type="left")x1x2y1115NA2263033740448NA>join(x,y,by="x2",type="full")#全部显示x1x2y1115NA2263033740448NA5NA1NA6NA220>y[,3]join(x,y,"x2",type="i

8、nner",match="first")x2x1y1V32623062734063、Linux下的数据列合并3.1join在R里面我们有join函数来进行数据列的合并,在Linux下,我们也有jion函数,也是用来进行数据列的合并的,跟R里面的merge和join是类似的功能。我们来看下它的用法:join用来将来自两个分类文本文件的行连在一起。文本文件中的域通常由空格或tab键分隔,但如果愿意,可以指定其他的域分隔符。一些系统要求使用join时文件域要少于20,为公平起见,如果域大

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。