土地数据分析与建模

土地数据分析与建模

ID:42628571

大小:1.24 MB

页数:8页

时间:2019-09-19

土地数据分析与建模_第1页
土地数据分析与建模_第2页
土地数据分析与建模_第3页
土地数据分析与建模_第4页
土地数据分析与建模_第5页
资源描述:

《土地数据分析与建模》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、土地数据分析与建模实验报告汪帆2011306200513土规1202班(1)编程实现以下任务:将landprice中四类土地用途(变量yongtu_1)为C(商业)、CR(商住混合)、R(住宅)和P(工业)的出让样本点提取出来,并保存为一个新的数据集landprice1(即landprice的一个子集),然后分以上四种土地利用类型求取landprice1中的观测样本点的楼面价(变量名为loumianjia)的统计量(MEANS);(2)根据means过程步给出的结果对四种土地利用类型出让地块样本点的楼面价进行描述性统计分析,并进行对比(集中性、离散度、峰度、偏度

2、)。注:在分析之前,可以进行极值检测,若存在极值,可在去除极值之后,再进行分析。要求给出程序、运行结果和描述性统计分析结果。实验步骤:(1)先导入数据菜单栏中:“文件/导入数据”,弹出如下对话框,图1.1。单击“next”,如图1.2。选择实验数据后,单击ok。弹出命名和选择逻辑库对话框,选择“work”,命名为“landprice”,最后在逻辑库中有如图1.3sas数据集。图1.1文件类型选择图1.2文件选择图1.3(2)四种类型样本点的抽选程序如下:程序1:datalandprice1;setlandprice;whereyongtu_1='C'oryong

3、tu_1='CR'oryongtu_1='R'oryongtu_1='P';run;运行的结果如图1.4,图1.5所示图1.4筛选结果部分图图1.5(3)对四种类型的样本画散点图,以判断是否有极值点或者异常值出现程序如下:程序2:procgplotdata=landprice1;plotloumianjia*id;byyongtu_1;run;运行结果如图1.6-1.9所示:图1.6用途为C类的散点图分布图1.7用途为CR类的散点图分布图1.8用途为P类的散点图分布图1.9用途为R类的散点图分布通过观察发现,四类用途的楼面价除P类难以观察外,其余三类均存在异常值

4、,故而需要用univariate程序段进行极值判断。(4)极值求取程序如下:程序3:procunivariatedata=landprice1;byyongtu_1;run;结果如下:图1.10用途为C的楼面价相关统计量计算上下截断点:下截断点:A=Q1-1.5*四分位极差=1627.937-1.5*2034=-1423.063上截断点:B=Q3+1.5*四分位极差=3662.392+1.5*2034=6713.392再将上面两种截断点与极值观测中的5个极小值和极大值进行比较发现:极小值点均在下截断点之上,故而无须删除;极大值点中的第25号(ID为161;135

5、77.87)、14号(ID为95;9150.24)点均大于6713.392,故而删除。图1.11用途为CR的楼面价相关统计量与用途为C的楼面价类似,求得用途为CR的楼面价的上下截断点的值分别为:-188.709,4054.843。故而要删除的点除上述极大值表中的5个值(ID分别为:93,、195、241、162、218),还要删除ID为263、56、190、152、128、179的点。图1.12用途为P的楼面价统计量用途为P的楼面价上下截断点位置为:1208.923、-288.575。而通过比较,均无观测值超出该范围,故而该处无须删除点。图1.13用途为R的楼面

6、价相关统计量用途为R的上下截断点为:4416.999、-1675.205,故而总共要删除如下点。ID号为:18821718521321696139180199101348133340194(5)对删除极值后的四种类型用地进行相关统计量的求取。按题目要求,程序如下:程序4:datalandprice2;setlandprice1;ifIDnotin(95161931952411622182635619015217918821718521321696139180199101348133340194);run;procsortdata=landprice2;byyon

7、gtu_1;run;procmeansdata=landprice2nmeanstdmedianskewnesskurtosisq1q3rangemaxmin;varloumianjia;byyongtu_1;run;运行结果如下图1.14-1.17所示。图1.14用途为C的相关统计量图1.15用途为CR的相关统计量图1.16用途为P的相关统计量图1.17用途为R的相关统计量(6)描述性统计分析(集中性、离散度、峰度、偏度)表1各类用途的统计量综合表用途均值标准差中位数偏度峰度上四分位下四分位半极差极差最大值最小值C2616.91288.242370.580.8

8、890.4243437.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。