数据挖掘模拟卷new

数据挖掘模拟卷new

ID:18592015

大小:54.50 KB

页数:5页

时间:2018-09-19

数据挖掘模拟卷new_第1页
数据挖掘模拟卷new_第2页
数据挖掘模拟卷new_第3页
数据挖掘模拟卷new_第4页
数据挖掘模拟卷new_第5页
资源描述:

《数据挖掘模拟卷new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《数据挖掘》模拟卷一、填空题(每格1分,共20分)1、在数据挖掘中,常用的聚类算法包括:划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法。2、数据仓库的多维数据模型可以有三种不同的形式,分别是:星型模式、雪花模式和事实星座模式。3、从数据分析的角度看,数据挖掘可以分为两类:描述性的数据挖掘和预测性的数据挖掘。4、给定基本方体,方体的物化有三种选择:不物化、全物化和部分物化。5、当前的数据挖掘研究中,最主要的三个研究方向是:数据库技术、统计学、机器学习。6、概念分层有四种类型,分别是:模式

2、分层、集合分组分层、操作导出的分层和基于规则的分层。7、两种常用的大数据集的数据概化方法是:数据立方体方法(或OLAP)和面向属性的归纳方法。二、单选题(请选择一个正确答案填入括号内,每题2分,共20分)1.下面哪种分类方法是属于神经网络学习算法?()A.判定树归纳B.贝叶斯分类C.后向传播分类D.基于案例的推理2.置信度(confidence)是衡量兴趣度度量()的指标。A、简洁性B、确定性C.、实用性D、新颖性3.孤立点挖掘适用于下列哪种场合?A、目标市场分析B、购物篮分析C、模式识别D、信用卡欺诈检

3、测4.存放最低层汇总的方体称为:A、顶点方体B、方体的格C、基本方体D、维5.数据归约的目的是()A、填补数据种的空缺值B、集成多个数据源的数据C、得到数据集的压缩表示D、规范化数据6.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?A.数据清理B.数据集成C.数据变换D.数据归约7.()通过将属性域划分为区间,从而减少给定连续值的个数。A.概念分层B.离散化C.分箱D.直方图8.下面的数据操作中,()操作不是多维数据模型上的OLAP操作。A、上卷(roll-up)B、选择(select)C、切片(

4、slice)D、转轴(pivot)9.假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是()A.关联分析B.分类和预测C.孤立点分析D.演变分析E.概念描述10.下列哪个描述是正确的?()A、分类和聚类都是有指导的学习B、分类和聚类都是无指导的学习C、分类是有指导的学习,聚类是无指导的学习D、分类是无指导的学习,聚类是有指导的学习三、多选题(请选择两个或两个以上正确答案填入括号内,每题3分,共15分)1.根据关联分析中所涉及的数据维,可以将关联规则分类为:()A、布尔

5、关联规则B、单维关联规则C、多维关联规则D、多层关联规则2.下列哪些是数据变换可能涉及的内容?A、数据压缩B、数据概化C、维归约D、规范化3.说明任务相关的数据时,涉及说明()A、包含相关数据的数据库或数据仓库名B、选择相关数据的条件C、相关的属性或维D、关于检索数据的排序和分组指令4.从结构的角度看,数据仓库模型包括以下几类:A.企业仓库B.数据集市C.虚拟仓库D.信息仓库5.数据仓库的主要特征包括()A、面向主题的B、集成的C、时变的D、非易失的四、简答题(共25分)1.简述面向属性归纳的基本思想,并

6、说明什么时候使用属性删除,什么时候使用属性概化。(7分)答:面向属性归纳的基本思想是:首先使用关系数据库查询收集任务相关的数据;然后通过考察任务相关数据中每个属性的不同值的个数,进行概化(通过属性删除或者属性概化)。聚集通过合并相等的广义元组,并累计他们相应的计数值进行。这压缩了概化后的数据集合。结果广义关系可以映射到不同形式,如图表或规则,提供用户。(3分)使用属性删除的情况:如果初始工作关系的一个属性上有大量的不同值,但是(1)在此属性上没有概化操作符,或(2)它的较高层概念用其他属性表示;(2分)使

7、用属性概化的情况:如果初始工作关系的一个属性上有大量的不同值,并且该属性上存在着概化操作符。(2分)2.为什么在进行联机分析处理(OLAP)时,我们需要一个独立的数据仓库,而不是直接在日常操作的数据库上进行。(6分)答:使用一个独立的数据仓库进行OLAP处理是为了以下目的:(1)提高两个系统的性能操作数据库是为OLTP而设计的,没有为OLAP操作优化,同时在操作数据库上处理OLAP查询,会大大降低操作任务的性能;而数据仓库是为OLAP而设计,为复杂的OLAP查询,多维视图,汇总等OLAP功能提供了优化。(

8、2)两者有着不同的功能操作数据库支持多事务的并行处理,而数据仓库往往只是对数据记录进行只读访问;这时如果将事务处理的并行机制和恢复机制用于这种OLAP操作,就会显著降低OLAP的性能。(3)两者有着不同的数据数据仓库中存放历史数据;日常操作数据库中存放的往往只是最新的数据。3.对于具有递减支持度的多层关联规则挖掘,分别都有哪些搜索策略?各有什么特点?(6分)答:具有递减支持度的多层关联规则挖掘中使用的搜索策略包括:逐层独立:完

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。