SQLServer数据仓库与数据挖掘.ppt

SQLServer数据仓库与数据挖掘.ppt

ID:51730720

大小:1.77 MB

页数:58页

时间:2020-03-30

SQLServer数据仓库与数据挖掘.ppt_第1页
SQLServer数据仓库与数据挖掘.ppt_第2页
SQLServer数据仓库与数据挖掘.ppt_第3页
SQLServer数据仓库与数据挖掘.ppt_第4页
SQLServer数据仓库与数据挖掘.ppt_第5页
资源描述:

《SQLServer数据仓库与数据挖掘.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、8.1SQLServer2005的功能构架SQLServer2005的数据资源管理包括两大功能体系,一是关于数据库的管理,二是关于数据仓库的管理。8.1SQLServer2005的功能构架SQLServer2005在数据仓库方面提供了三大服务和一个工具来实现系统的整合。三大服务是SQLServer2005AnalysisServices(SSAS)、SQLServer2005IntegrationServices(SSIS)SQLServer2005ReportingServices(SSRS),一个工具是BusinessIntelligenceDevelopmentStudio。8.

2、1SQLServer2005的功能构架8.1SQLServer2005的功能构架SSIS能从各种异构数据源中整合数据到数据仓库中,这项功能在以前是通过DTS服务(即数据转换服务)来实现的。SSAS是从数据中产生知识的关键,通过这种服务,可以构建数据立方(Cube),也就是多维数据集,然后进行OLAP分析,SSAS也提供数据挖掘的功能。SSRS是报表设计工具,通过它可以对分析结果提供类型多样、美观且适合不同需求的图表和报表。8.3SQL Server集成服务8.3.1SQL Server集成服务的作用在SQLServer2005IntegrationServices(SSIS)中,可以方

3、便地创建解决方案,来执行提取、转换和加载数据(ETL)的处理。SSIS提供了设计、创建、部署和管理包的功能,用于处理日常的业务需求。8.3.1SQL Server集成服务的作用建立SSIS解决方案时,创建新的项目,该项目可以放在一般的方案管理之下,但它只是逻辑的管理单位,SSIS设计、新建、访问和执行的单位依然是包(Package),包可以理解为SSIS项目中基本的部署和执行单元。8.3.2控制流SSIS包中的控制流由一组任务组成。上图显示了一个简单的控制流示例。它以FTP任务开始,该FTP任务用于下载已压缩的数据文件。一旦下载完这些文件,运行时就会到达Foreach循环容器,在该容器

4、内部有三个任务:执行进程任务(该任务调用unzip应用程序来解压缩数据文件)、大容量插入任务和检查数据库完整性任务。当解压缩完数据文件,数据文件中的数据被加载到SQLServer中并检查完数据库的完整性时,循环会停止。如果在循环期间发生了错误,则该控制流将执行发送邮件任务:向DBA发送电子邮件。如果正确地执行了每个任务,则该控制流将执行SQL任务,然后更新统计信息。8.3.3数据流数据流是专门处理数据操作的工作流,也称为流水线。在数据流中的每个节点都称为转换。数据流通常以源转换开始,以目标转换结束。上图显示了一个数据流的示例。该数据流以OLEDBSource转换开始,该转换加载包含上市

5、公司基本情况的事实表。第二个转换是“查找”,该转换从上市公司基本情况表中查找上市公司简称。这列数据被加入到流水线的数据中。下一个转换是“条件性拆分”,该转换将“ST公司”与“正常公司”分开。由于分析中ST公司与正常公司可比性不强,属于异常值,需要剔出,因此“ST公司”转换为Excel目标表保存即可,“正常公司”的相关数据则到达“派生列”转换,该转换根据流通A股中个人持股数量和总股本数计算“个人持股比例”,再经过“聚合”转换,按行业求算“平均个人持股比例”,最后转换为“SQLServer目标”为后期的数据挖掘做准备。值得注意的是,在创建包以及数据流之前,需要充分了解在源数据和目标数据中使

6、用的格式。了解了这两种数据格式后,才能确定将源数据映射到目标数据所需的转换。8.3.4设计和使用ETL数据仓库的设计是数据分析和数据挖掘的基础工作,良好的数据仓库结构设计是以后工作能顺利进行的保证。数据仓库中的数据一般要从原始业务数据中获取,经过“提取-转换-加载”即ETL过程,对分析有帮助的数据将保存于数据仓库中。Step1单击“开始”菜单,选择“所有程序”,再指向MicrosoftSQLServer2005,再单击SQLServerBusinessIntelligenceDevelopmentStudio。在“文件”菜单上,选择“新建”,再单击“项目”。Step2在“新建项目”对话

7、框中,从“项目类型”窗格中选择“商业智能项目”,再在“模板”窗格中选择“IntegrationServices项目”,在“名称”框中,键入项目名称Stock_IS。Step3在“项目”菜单中选择“SSIS导入和导出向导”命令,在“选择数据源”窗口中的“数据源”下拉列表框中选择Access数据源选项,如图8.6所示。然后在路径选择中选择此项目文件夹中的stockDB.mdf文件。8.3.4设计和使用ETL8.3.4设计和使用ETLStep4在选择

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。