探索性数据分析

探索性数据分析

ID:68946691

大小:711.00 KB

页数:10页

时间:2021-10-23

探索性数据分析_第1页
探索性数据分析_第2页
探索性数据分析_第3页
探索性数据分析_第4页
探索性数据分析_第5页
探索性数据分析_第6页
探索性数据分析_第7页
探索性数据分析_第8页
探索性数据分析_第9页
探索性数据分析_第10页
资源描述:

《探索性数据分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、--研究生课程论文课程名称:探索性数据分析论文题目:同时描述两个变量的案例分析——基于JMP软件XX:学号:课程教师-.word.zl---本次将主要对第四章的同时描述两个变量进展简单地案例分析,这章主要将数据划分分两类:定类变量〔建模中包括定名型和定序型〕以及连续变量。在两个变量关系的研究中,我们需要分析上述两类变量的三种组合:两个定类变量、两个连续变量、连续变量和定类变量各一个。本章中,我们将会学习上述三种成对二元数据的几种常见分析方法。共同变化描述:两个定类变量主要通过初识二元分布图、马赛克图

2、、列联表描述共同变化描述:两个连续变量主要通过两个连续变量的分布、散点图、相关系数矩阵描述两组比拟:一个连续变量,一个定类变量主要通过单因子分析描述案例分析背景:高血压仍然是美国人的主要安康问题。数据表〔NHANES〕包含了来自于2005年美国对大量人群调查所得到的数据。在该案例分析中,我们只关注一下变量:RIAGENDR:受调查者的性别RIDAGEYR:受调查者的年龄〔单位:年〕RIDRETH1:受调查者的种族或民族背景BMXWT:受调查者的体重〔单位:千克〕BPXPLS:受调查者的静息脉率BPX

3、SY1:受调查者的收缩压〔最高值以BP为单位〕BPXD1:受调查者的舒图〔最小值以BP为单位〕-.word.zl---a、绘制收缩压与年龄的散点图。在这个样本中,血压会随着人们的年龄发生什么样的变化?绘制的散点图如下:二元拟合,以“RIDAGEYR〞拟合“BPXSY1〞-.word.zl---线性拟合BPXSY1=101.87455+0.4873796*RIDAGEYR拟合汇总R方0.333854调整R方0.333754均方根误差15.37906响应均值119.0438观测数〔或权重和〕6668方差

4、分析源自由度平方和均方F比模型1790155.27901553340.819误差66661576612.0237概率>F校正总和66672366767.2<.0001*参数估计值项估计值标准误差t比概率>

5、t

6、截距101.874550.35172289.65<.0001*RIDAGEYR0.48737960.00843257.80<.0001*图1散点图从上图可以看出,散点大局部都在红色拟合线附近,但散点呈现的形态与一条理想的直线的关系却相差甚远。在本例中R2为0.33,说明拟合效果较差,血压和年龄

7、之间的关系不是很明显。b、计算并输出收缩压和舒压之间的相关性度量。连续型数据的概括性描述被称为相关性分析,它度量了两个变量间线性相关强度。线性相关系数用字母r表示,是r方的平方根,因此,r的取值围是[-1.1]。r越接近区间端点,两个变量间的线性关系就越弱。两变量的相关系数矩阵如下列图2:-.word.zl---图2相关系数矩阵从上表可以看出,收缩压和舒压的相关系数是0.3993,说明两者的相关性不是很明显。-.word.zl---c、比拟男性和女性见收缩压的分布分布图如下:-.word.zl---

8、图3分布图从上图3可以看出,男性的收缩压和女性的收缩压差不多,男性为49.095%,女性为50.905%,说明收缩压和性别之间不存在特别大的关系。测量地大局部结果都集中在65~75之间。-.word.zl---d、比拟以种族或民族背景为依据的收缩压的分布。分布图如下:图4分布图-.word.zl---从上述图4可以看出,非西班牙裔白人收缩压占得比例最高,为37.97%,墨西哥裔美国其次,为27.528%,非西班牙裔黑人为26.281%。e、绘制收缩压与静息脉率的散点图。分布图如下:-.word.zl

9、---图5散点图从上述散点图可以看出,明显地看出静息脉率和血压没有明显的关系,拟合度很低,说明有人认为的静息脉率高,血压也高的结论是错误的。-.word.zl-

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。