南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料

南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料

ID:35797608

大小:16.53 KB

页数:8页

时间:2019-04-18

南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料_第1页
南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料_第2页
南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料_第3页
南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料_第4页
南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料_第5页
资源描述:

《南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2辅导资料》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-21、B2、C3、B4、A5、B一、单选题共20题,40分1、()用替代的、较小的数据表示形式替换原数据。A维归约B数量归约C离散D聚集正确答案是:B2、只有非零值才重要的二元属性被称作()。A计数属性B离散属性C非对称的二元属性D对称属性正确答案是:C3、职位可以按顺序枚举,对于教师有:助教、讲师、副教授、教授。职位属性是()。A标称属性B序数属性C数值属性D二元属性正确答案是:B4、()去掉数据中的噪声,这类技术包括分箱、回归和聚类。A光滑B聚集C规范化D属性构造正确答案是

2、:A5、在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为()。A基于类的排序方案B基于规则的排序方案C基于度量的排序方案D基于规格的排序方案正确答案是:B6、分位数是取自数据分布的每隔一定间隔上的点,把数据划分成基本上大小相等的连贯集合。如:4-分位数是()个数据点,它们把数据分布划分成4个相等的部分,使得每部分表示数据分布的四分之一。A1B2C3D4正确答案是:C7、决策树学习:决策树算法对数据处理过程中,将数据按()结构分成若干分枝形成决策树,从根到树叶的每条路径创建一个规则。

3、A树状B网状C星形D雪花形正确答案是:A8、以下属于可伸缩聚类算法的是()。ACUREBDENCLUECCLIQUEDOPOSSUM正确答案是:A9、()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。AMIN(单链)BMAX(全链)C组平均DWard方法正确答案是:C10、如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为()。A无序规则B穷举规则C互斥规则D有序规则正确答案是:C11、()是KDD。A数据挖掘与知识发现B领域知识发现C文档知识发现D动态知识发现正确答案是:A12、在有关数据仓库测试,

4、下列说法不正确的是()。A在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。测试工作中要包括单元测试和系统测试B当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试D在测试之前没必要制定详细的测试计划正确答案是:D13、假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用等频(等深)划分成四个箱时,15在第()个箱子内。A第一个B第二个C第三个D第四个正确答案是:B14、决策树中不包含以下哪种结点?()A根结点(ro

5、otnode)B内部结点(internalnode)C外部结点(externalnode)D叶结点(leafnode)正确答案是:C15、()是说属性的最低和最高值之间没有缺失的值,并且所有的值还必须是唯一的A唯一性规则B连续性规则C空值规则D解释性规则正确答案是:B16、在()的数据集上挖掘将更有效,而且会产生相同或几乎相同的分析结果。A归约后B集成后C离散后D规范后正确答案是:A17、检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测。A统计方法B邻近度C密度D聚类技术正确答案是:A18、假定用于分析的数据包含属性age。数据元组中ag

6、e的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为()。A18.3B22.6C26.8D27.9正确答案是:A19、OLAM技术一般简称为“数据联机分析挖掘”,下面说法正确的是()。AOLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性B由于OLAM的立方体和用于OLAP的立方体有本质的区别C基于WEB的OLAM是WEB技术与OLAM技术的结合DO

7、LAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作正确答案是:D20、以下哪项关于决策树的说法是错误的?()A冗余属性不会对决策树的准确率造成不利的影响B子树可能在决策树中重复多次C决策树算法对于噪声的干扰非常敏感D寻找最佳决策树是NP完全问题正确答案是:C二、多选题共10题,20分1、现实世界的数据一般是()。数据预处理技术可以改进数据的质量,提高挖掘过程的准确率和效率。A脏的B正确的C不完整的D不一致的正确答案是:ACD2、联机分析处理包括以下哪些基本分析功能()?A聚类B切片C转轴D切块正确答案是:BCD3、

8、离群点检测的挑战包括:()。A发现合适的数据模型B离群点检测系统对应的依赖性C找

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。