R软件及编程应用第六讲.ppt

R软件及编程应用第六讲.ppt

ID:56446398

大小:2.12 MB

页数:92页

时间:2020-06-18

R软件及编程应用第六讲.ppt_第1页
R软件及编程应用第六讲.ppt_第2页
R软件及编程应用第六讲.ppt_第3页
R软件及编程应用第六讲.ppt_第4页
R软件及编程应用第六讲.ppt_第5页
资源描述:

《R软件及编程应用第六讲.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、R软件及编程应用中南财经政法大学信息与安全工程学院刘树栋第六讲:概率与分布、探索性数据分析一、概率与分布二、探索性数据分析一、概率与分布1、随机抽样2、排列组合与概率计算3、概率分布4、R中内嵌的分布5、中心极限定理1、随机抽样在R语言中用函数sample()来实现:(1)等可能的不放回的随机抽样:sample(x,n),其中x为要随机抽样的向量,n为样本容量。例如从52张扑克牌中抽取4张对应的R命令为:sample(1:52,4)(2)等可能的有放回的随机抽样:sample(x,n,replace=TRUE),其中选项rep

2、lace表示抽样的有放回,此参数省略或replace=FALSE表示抽样不放回。例如抛一枚质地均匀的硬币10次的R命令为:sample(c(“H”,“T”),10,replace=T),掷一颗骰子10次的R命令为:sample(1:6,10,replace=T)1、随机抽样(3)不等可能的随机抽样:sample(x,n,replace=TRUE,prob=y),其中prob=y用于指定x中元素出现的概率,向量y与x等长度。例如一名外科医生做手术成功的概率为0.90,那么他做10次手术的R命令为:sample(c(“成功”,“失

3、败”),10,replace=TRUE,prob=c(0.9,0.1))。若1表示成功,0表示失败,此命令可变为:sample(c(1,0),10,replace=TRUE,prob=c(0.9,0.1))2、排列组合与概率计算例1、从一副完全打乱的52张扑克中取4张,求以下事件的概率:1)抽取的4张依次为红心A,方块A,黑桃A和梅花A的概率;2)抽取的4张为红心A,方块A,黑桃A和梅花A的概率。解:1)抽取的4张是有次序的,因此使用排列来求解.所求的事件(记为A)概率为:R中计算命令为:1/prod(52:49)结果:1.5

4、39077e-072、排列组合与概率计算2)抽取的4张是没有次序的,因此使用组合数求解.所求的事件(记为B)的概率为:R中计算命令为:1/choose(52,4)结果:3.693785e-064、随机抽样R中内嵌的分布函数R提供了四类有关统计分布的函数:密度函数、(累积)分布函数、分位数函数、随机数函数。它们都与分布的英文名称(或其缩写)相对应。下表列举了18个分布的英文名称、R中的名称和函数中的参数选项。举例举例还有均匀分布、指数分布、正态混合分布例子二、探索性数据分析1、常用发布的概率函数图2、直方图与密度函数的估计3、单

5、组数据的描述性统计分析4、多组数据的描述性统计分析5、分组数据的描述性统计分析数据的统计分析分为描述性统计分析和统计推断两部分,前者又称为探索性统计分析,它是通过绘制统计图形、编制统计表格、计算统计量等方法来探索数据的主要分布特征,揭示其中存在的规律。探索性数据分析是进行后期统计推断的基础。本章针对不同类型的数据通过R介绍的探索性数据分析技巧,分别从图形和描述性统计量(包括样本的均值、标准差、分位数、偏度、峰度等统计量)上刻划样本的特征。探索性数据分析概述(1)二项分布1、常用分布的概率函数图(2)泊松分布(3)几何分布(4)

6、超几何分布(5)负二项分布(6)正态分布(7)t分布(8)卡方分布(9)F分布(10)对数正态分布(11)柯西分布(12)威布尔分布(13)伽玛分布(14)贝塔分布(1)直方图直方图是探索性数据分析的基本工具,它给出了数据的频率分布图形,在组距相等场合下常用宽度相等的长条矩形表示,矩形的高低表示频率的大小。在图形上,横坐标表示变量的取值区间,纵坐标表示频率(或频数)的大小,这样就得到频数(或频数)直方图。图形的形状与我们选择的各组区间端点有关。2、直方图与密度函数的估计(1)直方图R中常用hist函数来画直方图其定义形式如下:

7、参数说明:若选项breaks取向量,则用于指明直方图区间的分割位置;若取正整数,则用于指定直方图的小区间数。freq取TRUE表示使用频数画直方图,取FALSE则使用频率画直方图。probability与freq恰好相反。col用于指明小矩形的颜色。(2)核密度估计样本的直方图粗略地描述了样本的分布,我们还可以用函数density()得到样本的核密度估计值,并用lines()得到密度估计的曲线。density()常用的调用格式如下:2、直方图与密度函数的估计参数说明:选项bw指定核密度估计的窗宽,也用字符串表示窗宽选择规则,具

8、体可参考函数bw.nrd()。kernel为核密度估计所使用的光滑化函数,缺省为正态核函数。n给出等间隔的核密度估计点。from与to分别给出需要计算核密度估计的左右端点.其它选项可参考density()的在线帮助。实例1:从二项分布binom(100,0.9)中抽取容量为N

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。