《数据仓库与数据挖掘》指导书概述

《数据仓库与数据挖掘》指导书概述

ID:19233395

大小:43.50 KB

页数:13页

时间:2018-09-30

《数据仓库与数据挖掘》指导书概述_第1页
《数据仓库与数据挖掘》指导书概述_第2页
《数据仓库与数据挖掘》指导书概述_第3页
《数据仓库与数据挖掘》指导书概述_第4页
《数据仓库与数据挖掘》指导书概述_第5页
资源描述:

《《数据仓库与数据挖掘》指导书概述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、《数据仓库与数据挖掘设计》指导书《数据仓库与数据挖掘设计》指导书自编东华理工大学软件学院数据仓库与数据挖掘课程组2012年11月11《数据仓库与数据挖掘设计》指导书目录实验一:数据仓库的环境配置与构建实验实验二:数据仓库的OLAP技术实验实验三:数据挖掘方法实践实验11《数据仓库与数据挖掘设计》指导书实验一、数据仓库的环境配置与构建实验实验目的:1)了解数据挖掘与商务智能之间的联系与区别;2)分析数据挖掘仓库的特性和构架;3)掌握数据挖掘的功能和建模的标准CRISP-DM。4)掌握MSS的分析服务、报表服务和整合服务,并能够用以解决实际问题。实验结果分析与要求:完成实验目的

2、中的内容,记录操作中的各个步骤,并进行分析。实验内容:1、将Excel数据表导入SQL数据库中的数据表材料:SQL范例资料.xls中的三国表。软件:SQLServer2008R2基本步骤:1)首先按照三国表中的属性在数据口中建立对应的表。2)打开VS选择项目中的“IntegrationServices”项目,并制定项目的保存位置,最后单击“确定”按钮即可新建一个SSIS项目。3)在“控制流”选项卡中,从工具箱拖拽“数据挖掘查询任务”的图示到工作区中。4)切换“数据流”11《数据仓库与数据挖掘设计》指导书选项卡,先制定数据的源,因为要导入的是Excel数据,所以从工具箱拖拽E

3、xcel源的图示到工作区中,然后再Excel源上右击,选择菜单上的“编辑”。1)在Excel源编辑器中,单击“新建”按钮来制定Excel数据的源,在Excel连接管理器中,单击“浏览”按钮来选择Excel文件,完成后单击“确定”按钮。2)在“Excel工作表的名称”下拉列表中选择要导入的数据表,然后单击“确定”按钮,完成数据源的设置。3)建立数据转换,从工具箱中拖拽“数据转换”到工作区中。4)在Excel源上右击,选择“添加路径”。5)指定“Excel源”到“数据转换”,最后单击“确定”按钮。6)输出指定“Excel源输出”,输入指定“数据转换输入”,单击“确定”按钮。7)

4、设置数据流的目标,要导入到SQL的数据库中,从工具箱中拖拽“SQLServer目标”到工作区。8)然后在“数据转换”上右击,选择添加路径来建立与数据流目标的连接。9)在“数据流”对话框中,指定从“数据转换”到“SQLServer目标”,单击“确定”按钮。在“选择输入输出”对话框中,输出指定“数据转换输出”,输入指定“SQLServer目标输入”,单击“确定”按钮。10)最后设置数据导入的位置,在“SQLServer目标”上右击,选择“编辑”。11)在“SQL目标编辑器”窗口中,单击“新建”11《数据仓库与数据挖掘设计》指导书按钮,然后在“配置OLEDB连接管理器”窗口转中,

5、同样单击“新建”按钮。1)在“连接管理器”窗口中,“服务器名”选择SQL数据库的位置,在“登录到服务器”中选择“使用windows身份验证”,在“选择或输入一个数据库名”指定数据要导入的数据库,单击“确定”按钮返回上一个窗口,再单击“确定”按钮。2)最后要指定数据要导入哪一个数据表,选择完成后单击“确定”按钮。3)接下来选择“映射”,接着单击“确定”按钮即可。4)现在已经完成配置,单击“启动调用”按钮,测试是否错误,执行完毕为绿色,执行中为黄色,错误为红色。5)可以到导入的SQL数据库的数据表位置查看数据是否都已经导入了。选择SQLServerManagementStudi

6、o打开后找到之前导出的数据表来查看。6)选择“选择前1000行”后则可以看到结果。2、对数据进行抽样材料:SQL范例资料.xls中的三国表。软件:SQLServer2008R2基本步骤:在“数据转换”中选择“百分比抽样”,抽样的百分比为20%。其他同“将Excel数据表导入SQL数据库中的数据表”的操作步骤。11《数据仓库与数据挖掘设计》指导书实验二、交换机数据仓库的OLAP技术实验实验目的:1)掌握决策树模型的基本概念和计算方法,并用其预测三国表中“身份属性”与其他属性的关系;2)掌握贝叶斯分类器的基本概念,并用其预测三国表中“身份属性”与其他属性的关系;3)掌握关联规则

7、的基本概念和种类,并用其预测“肾细胞癌转移情况”。4)对比以上三种模型,分析其联系与区别。实验结果分析与要求:完成实验目的中的内容,记录操作中的各个步骤,并进行分析。实验内容:1、使用决策树模型预测三国表中“身份属性”与其他属性间的关系;材料:SQL范例资料.xls中的三国表。软件:SQLServer2008R2基本步骤:1)首先将三国表导入到SQL数据库中。2)新建AnalysisService项目,进入项目中的新建挖掘结构,使用数据挖掘向导来建立,进入数据挖掘向导首页后单击11《数据仓库与数据挖掘设计》指导书“

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。