数据仓库中实视图的选择与维护技术的研究

数据仓库中实视图的选择与维护技术的研究

ID:33176643

大小:5.30 MB

页数:105页

时间:2019-02-21

数据仓库中实视图的选择与维护技术的研究_第1页
数据仓库中实视图的选择与维护技术的研究_第2页
数据仓库中实视图的选择与维护技术的研究_第3页
数据仓库中实视图的选择与维护技术的研究_第4页
数据仓库中实视图的选择与维护技术的研究_第5页
资源描述:

《数据仓库中实视图的选择与维护技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一一~一~召塑恕};-:AmN}44%YlRtr"摘要数据仓库是随着企业竞争对于决策信息的需求以及计算机技术的飞速发展而产生的。数据仓库的结构设计是数据仓库研究和开发的核心问题之一。数据仓库是多个分布的、异质的、自治的数据源的集成信息库,数据仓库中的信息以视图的形式存储,叫实视图。它通过物理上的预先存储,加快了用户的查询响应时间。实视图的使用和研究大大提高了数据仓库的性能。本文主要研究以下几个方面的内容:(1)实视图的选择是数据仓库开发中的重要问题。数据仓库存储实视图主要为OLAP查询,用户查询响应时间是首要考虑的问

2、题,本文提出查询代价视图选择问题,为解决该问题,给出了视图选择代价图及其构造方法。同时给出了查询代价视图选择问题的代价模型和实视图选择的过程。(2)基于给出的代价模型,采用贪心算法动态实现实视图的选择。原有的贪心算法解决实视图选择问题时,需要人为的确定实视图的个数k,很难达到满意的结果,从而影响OLAP的分析质量。本文使用贪心算法动态的确定k值,采用满足查询代价给定的限制下,使维护代价最小的选择原则。(3)本文提出了使用随机算法解决实视图选择问题。首先给出了遗传方法解决查询代价视图选择问题的算法(GAesVSP),提

3、出对查询代价视图选择问题的遗传算法表示方法,针对给定的视图选择代价图,将其转换为遗传算法中的二进制编码,以及对应的遗传操作,同时定义了适应度函数。匡GAVSP算法中,随着遗传进程的发展,产生合法解会变得越来越困难,l4良多解1都被排除在外了,加长了产生解的时间,增大了产生解的难度。因此,本文提出一种改进算法(SAGAesVSP),将模拟退火思想和遗传算法综合在一起,来解决查询代价视图选择问题。改进的算法中利用遗传规则产生选择实视图的方案,利用模拟退火的思想判断是否接受该方案,这样进一步扩展解的选取空间,保持解的多样性

4、,降低产生解的难度,从而去找到近似最优解。为了测试实视图选择算法的功能和效率,进行了实验模拟,证明了所采用的方法给出了实视图选择的近似解,同时也表明对查询代价视图选择问题,GAVSP算法优于贪心算法,SAGAVSP的算法优于GA算法。随机算法用于实视图的选择将成为数据仓库开发中有价值的工具(4)实视图的维护有重新计算和增量维护两种方法。本采用增量维护的方法,但在增量计算中,同一个视图采用不同的方法,其增量的计算量是不同的,导致的视图维护代价也不同,因此提出最小增量维护的思想和策略,给出实视图和增量表达式的定义以及最小

5、增量维护的算法。在数据量极大的数据仓库中,这种方法降低了实视图的维护代价,提高了数据仓库的处理效哈尔滨工程大学博士学位论文率。C5)本文利用实视图技术来优化查询。在分析传统优化查询方法的基础上,对其进行改进和扩展,给出了使用实视图进行优化查询的方法和策略,以有效提高查询处理速度。(6)本文通过分析数据仓库体系模型的特点,结合CRGC-CIMS工程,提出在CIMS环境下数据仓库的体系结构,并给出CRGC-CIMS的数据仓库的建模及总体绍构,以为实视图技术的进一步研究提供一个应用环境。关键词:数据仓库:OLAP;算法;实

6、视图选择:实视图维护一~一一一-掣丝掣翼鹦塑塑皇竺些AbstractWiththeneedsofdecision-supportinformationofenterpriseandthefastdevelopmentofcomputertechnologies,datawarehousetechnologycomeout.Thearchitecturedesignofdatawarehouseisoneofthecoreresearchproblemsinstudyingandevolutionofdatawareh

7、ouse.Thedatawarehouseisarepositoryofinformationcollectedfrommultiple.possiblyheterogeneous,autonomous,distributeddatabases.Theinformationstoredatthedatawarehouseisinformofviews,referredtoasmaterializedviews.Thequeryrespondingtimecanbespeededbypre-storing.Theper

8、formanceofthedatawarehousehasbeenimprovedbyusingandstudyingmaterializedviews.Thefollowingaspectsarefocusedinthedissertation:(1)Theselectionofthematerializedviewsisoneofthemo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。