OLAP与数据挖掘分析.doc

OLAP与数据挖掘分析.doc

ID:59253739

大小:1.11 MB

页数:12页

时间:2020-09-08

OLAP与数据挖掘分析.doc_第1页
OLAP与数据挖掘分析.doc_第2页
OLAP与数据挖掘分析.doc_第3页
OLAP与数据挖掘分析.doc_第4页
OLAP与数据挖掘分析.doc_第5页
资源描述:

《OLAP与数据挖掘分析.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、浙江万里学院实验报告成绩:教师:课程名称:OLAP与数据挖掘实验名称:实验分析报告一、实验目的:以往实验结果分析、思考、研究、疑惑、经历、体会、收获二、实验内容:1.非参数检验结果分析:频数表中残差值越小,说明实际频数与期望频数越接近。卡方检验表中卡方统计量等于3.492,自由度等于2,对应的概率P值0.174大于显著性水平0.05。因此接受零假设,人数的调动只是随机误差造成的,公司人员结构没有显著性改变。体会、收获:通过上述的实验我对非参数检验中的卡方检验有了初步的了解。首先提出零假设:样本X来自的总体分布服从期望分布或某一理论分布。接着

2、,卡方检验是利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量,它描述了观察值和理论值之间的偏离程度。专业班级:___姓名:__学号:实验日期:结果分析:描述性统计量表中共选择了30个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13小时,标准差等于40.968小时,最小值等于947小时,寿命最大值等于1084小时。同时其25%、50%和75%分位点等于962.75、969.50和996.75小时。二项检验表:组1和组2它们各自的样本容量等于6和24。检验组1所占比例是否等于0.05。P值0.003小于显著性水平0.05

3、,可以判断这批样本这批产品没有合格。体会、收获:二项分布与卡方分布具有一定的相似性,两者都是通过与显著性水平的比较,判断该分布是否具有显著性差异。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为总体与某个指定的二项分布有显著性差异;相反的,如果概率P值大于显著性水平,则接受零假设。结果分析:游程检验的Z统计量值等于-2.384,概率P值0.017小于显著性水平0.05,说明数据的排序呈现一定的规律性。因此,工业企业和商业企业的负债水平有显著性差异。体会收获:游程检验可用来检验任何序列的随机性,而不管这个序列是怎样产生的;此外还

4、可用来判断两个总体的分布是否相同,从而检验出它们的位置中心有无显著差异。结果分析:实际分布和检验分布之间的正向最大频数差为0.019,负向最大频数差为-0.010,因此用于计算统计量的绝对值最大频数差为0.019。随后的K-S统计量Z值等于0.750,相应的概率P值为0.627,大于显著性水平0.05。所以接受零假设。体会收获:单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,一般来说它是比卡方检验更精确的非参数检验法。结果分析:卡方统计量等于8.736,自由度等于2,对应的概率P值0.013小于显著性水平0.05,所以拒绝零假设

5、。即三种糖果的卡路里含量存在显著差异。体会收获:多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的分布是否存在显著差异。结果分析:Z统计量值等于-2.558,概率P值0.11大于显著性水平0.05,所以接受零假设。即听音乐和不听音乐两种条件下入睡时间没有显著差异。 体会收获:两配对样本的非参数检验是在对两组配对样本的总体分布不甚了解的情况下,推断样本来自的两个总体的分布等是否存在显著差异的方法。相关分析结果分析:由描述统计表可以看出DJIA和SP的平均均值分别为7743.60和945.10,两者差距很大。同时,两者的

6、方差差距也很明显。 由相关性表可以看出两种指数的Pearson系数值为0.995;同时相伴概率P值明显小于显著性水平0.01,说明两者高度正线性相关。 体会收获:根据对该实验的了解,相关分析能够帮助我们判断变量之间有无联系以及确定选择相关关系的表现形式及相关分析方法。结果分析:由以上各表分析可以看出在控制了股市指数后,银行间和交易所市场间的相关系数没有发生太大变化,仍然为0.906,说明了这两个市场的关系密切。而银行间国债市场、交易所国债市场与股市的偏相关系数却发生了显著变化,银行间市场和股市的Pearson相关系数为0.419,而在控制了

7、交易所指数后,它们之间的偏相关系数下降为0.114;同理,交易所国债市场和股市的相关系数也由0.411下降到0.070。这说明了第三方市场对剩余两个市场确实存在显著影响。体会收获:刚开始做偏相关分析,我在想偏相关与简单的相关分析有什么不同,后来随着实验的进行我了解到偏相关分析是在相关分析的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。结果分析:由上表分析可得,居民消费价格指数和城市居民消费价格指数、农村居民消费价格指数和商品销售价格指数的距离都比较小,说明它们都反映了社会总体或某

8、方面价格水平的高低;但它和工业品出厂价格指数、原材料等购进价格指数和固定资产投资价格指数的距离都较大,说明这些价格指数反映的类型有较大差别。收获体会:距离分析是对观测量之间或变量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。