构建基于数据仓库的dss

构建基于数据仓库的dss

ID:24176289

大小:49.50 KB

页数:4页

时间:2018-11-12

构建基于数据仓库的dss_第1页
构建基于数据仓库的dss_第2页
构建基于数据仓库的dss_第3页
构建基于数据仓库的dss_第4页
资源描述:

《构建基于数据仓库的dss》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、构建基于数据仓库的DSS

2、第1(2)数据抽取模块该模块是根据元数据库中的主题表定义、数据源定义、数据抽取规则定义对异地异构数据源(包括各平台的数据库、文本文件、HTML文件、知识库等)进行清理、转换,对数据进行重新组织和加工,装载到数据仓库的目标库中。在组织不同的数据过程中,先将数据转换成一种中间模式,再把它移至临时工作区。加工数据是保证目标数据库中数据的完整性、一致性。例如,有两个数据源存储与人员有关的信息,在定义数据组成的人员编码类型时,可能一个是字符型,一个是整型;在定义人员性别这一属性的类型时,一个可能是char(2),存储的数据值为“

3、男”和“女”,而另一个属性类型为char(1),数据值为“F”和“M”。这两个数据源的值都是正确的,但对于目标数据来说,必须加工为一种统一的方法来表示该属性值,然后交由最终用户进行验证,这样才能保证数据的质量。在数据抽取过程中,必须在最终用户的密切配合下,才能实现数据的真正统一。早期数据抽取是依靠手工编程和程序生成器实现,现在则通过高效的工具来实现,如Ardent公司的Infomoter产品、SAS的数据仓库产品SAS/ining),在DDS环境中数据仓库直接为联机分析处理和数据挖掘提供数据能力。1.联机分析处理(OLAP)OLAP是针对特定问

4、题的联机数据访问和数据分析而产生的一种技术,它满足DDS从多种角度对数据进行快速、一致、交互地分析,克服传统DDS交互能力差的弊病,使决策者能够对数据进行深入观察。OLAP服务器使用为用户预定义的多维数据视图对数据仓库的信息进行统计分析处理,为具有明确分析范围和分析要求的用户提供高性能的决策支持。OLAP将分析结果存储在信息库中,便于决策者通过对比多种分析结果作出更好的决策。此外,信息库中还存放决策准则、管理经验、常识。OLAP工具目前以多维分析/ROLAP为主,如InformixMetacube分析工具软件。2.数据挖掘数据挖掘是指从大量数据

5、中发现潜在的、有价值的及未知的关系、模式和趋势,并以易被理解的方式表示出来。在DDS中通过进行数据挖掘用以发现数据之间的复杂联系以及这种联系对决策的影响。在数据仓库基础上挖掘的知识通常以图表、可视化、类自然语言等形式表示出来,但所挖掘的知识并不都是有意义的,必须进行评价、筛选和验证,把有意义的知识放到知识库中,随着时间的推移将积累更多的知识。知识库根据挖掘的知识类型包括总结性知识、关联性知识、分类模型知识、聚类模型知识,这些知识通过相应挖掘算法得到。五.基于数据仓库的DDS决策可以解决哪些类型的问题DDS可以解决4个类型的问题:(1)查询一组数

6、据,可回答的问题如产品A的价格是多少?(2)采用数理统计模型、运筹模型进行定量分析,预测趋势,可回答的问题如:某产品明年销售形势如何?(3)采用OLAP方法,通过代数运算将有关信息抽取出来作为问题的答案,如:某月某公司的销售怎样?(4)采用数据挖掘技术,通过对数据进行逻辑运算,找出它们之间内在联系,可回答的问题如:在某地影响某产品销售的因素是什么?第1类和第2类问题在过去传统DDS中得到一定解决,现在的DDS重点解决第3类和第4类问题。这些问题的提出与回答通过可视化工具在问题综合与交互系统中实现,可视化工具提高人机接口开发质量和效率,使人机界面

7、更加简洁、标准化。另外,可选用手写输入和声音输入工具软件,便于决策者提出问题。该系统根据对决策问题的判断,在知识库和信息库中查找解决方案,如查找到以直观易理解的形式呈现给决策者,如查找不到再根据问题的性质向下调用相应的决策工具。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。