统计数据仓库体系中数据分析系统及其研究.pdf

统计数据仓库体系中数据分析系统及其研究.pdf

ID:52458913

大小:170.01 KB

页数:4页

时间:2020-03-27

统计数据仓库体系中数据分析系统及其研究.pdf_第1页
统计数据仓库体系中数据分析系统及其研究.pdf_第2页
统计数据仓库体系中数据分析系统及其研究.pdf_第3页
统计数据仓库体系中数据分析系统及其研究.pdf_第4页
资源描述:

《统计数据仓库体系中数据分析系统及其研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第43卷增刊1大连理工大学学报Vol.43,S12003年10月JournalofDalianUniversityofTechnologyOct.2003文章编号:1000-8608(2003)S1-S146-04统计数据仓库体系中数据分析系统及其研究杨文川*1,郁文生2,黄涛3(1.北京邮电大学电信工程学院,北京100876;2.中国科学院自动化研究所复杂系统与智能科学实验室,北京100080;3.北京大学光华管理学院,北京100871)摘要:数据仓库最重要的特征就是实现数据的集成与共享.基于统计数据仓库的数据分析系统众多,因此首先对统计数据仓库体系进行研究,然后对联机分析、决策支

2、持及数据挖掘这3类分析工具进行对比研究,并通过介绍“万峰统计数据仓库”中数据分析部分的功能及划分,为统计数据仓库数据分析系统的研发提供了理论基础和实践依据.关键词:数据仓库;联机分析;决策支持;数据挖掘中图分类号:TP392文献标识码:A0引言要求为实现从统计数据中提取决策支持信息而建立的一套统计数据仓库体系结构.它基于统计行统计部门是政府一个重要职能部门,负责为业大量的宏观经济数据,能够为政府宏观决策提政府提供宏观决策的数据依据.鉴于统计数据量供支持和分析预测.依据仓库存储的大量国民经庞大、来源众多、口径不一,现有的联机事务处理济数据,可供专家和决策者分析宏观经济现状,预环境无法较

3、好地同时决策支持信息等问题,目前测经济发展趋势,以联机分析(onlineanalytical统计系统转向采用数据仓库技术实现决策支持的processing,OLAP)等多种形式展示.[1]功能.数据仓库是面向主题的、集成的、非易失“万峰统计数据仓库”从功能上可以大致分的、随时间积累的、适合用于为管理者决策过程提为数据准备和处理、数据查询和展示及数据和预供支持的数据集合.测3个阶段,如图1所示.“万峰统计数据仓库”正是根据统计部门的图1统计数据仓库及阶段分类Fig.1Statisticdatawarehouseanditsstepclassify(1)数据准备和处理:包括源数据的准备,

4、数围绕主题以星型模式存放,其数据也由一般业务据的清洗、转换、装载,经过处理的数据在仓库中数据的关系型表,转换为说明主题的事实表和相收稿日期:2003-06-01.基金项目:国家自然科学基金资助项目(60204006).作者简介:杨文川*(1970-),男,博士,副教授,E-mail:wchyang@21cn.com.增刊1杨文川等:统计数据仓库体系中数据分析系统及其研究S147关维表,这些表存放在数据仓库中,另外有相应的企业的中高层领导,它们执行的都是决策和趋势元数据库控制它们的结构,负责数据的维护等工分析类的应用,DSS中的一些技术可以很好地集作.成到数据仓库中,并使数据仓库的分析

5、能力更加(2)数据查询和展示:仓库数据经过不同厂强大.例如:DSS中的传统统计分析模型可以帮家提供的联机分析服务器的处理,经过主题、维助用户对数据仓库中的数据进行更加有效、深入度、层次、计算、数据映照等各相关流程的处理,形的分析,从而更好地掌握和利用信息.而一些智成了一个多维的数据立方体,可以被联机分析前能决策技术,如人工神经网络在发现顾客行为模端展示工具所查询和展示.式、预测金融市场行为等方面显示了强大的功能.(3)数据分析和预测:经过联机分析处理的这些DSS的核心技术在数据仓库中的应用不但数据,仅仅实现了数据的多维和层次视图,有部分会大大提高数据仓库的决策支持能力,同时也使数据可

6、以根据维度层次实现加总或拆分,甚至一DSS的应用范围更加广泛.[4]些简单的处理,完全无法满足统计系统的数据分1.3数据挖掘析要求,由此,数据分析实际是最重要和有实际意数据挖掘是当前业界的热门技术,已经在多义的工作.个应用领域产生了巨大的效益.数据挖掘不一定要建立在数据仓库的基础上,但是如果将数据挖1数据分析的3类工具比较掘和数据仓库协同工作,则可以简化数据挖掘过数据分析为决策支持提供直接分析工具,也程的某些步骤,从而大大提高数据挖掘的工作效可以定义为数据仓库系统的工具层.OLAP的查率.并且因为数据仓库的数据来源于整个企业,询分析型工具、DSS的分析预测型工具、数据挖掘保证了数据挖

7、掘中数据来源的广泛性和完整性.的挖掘型工具一起构成了数据仓库系统的工具数据挖掘技术是数据仓库应用中比较重要也是相层.对独立的部分.目前,数据挖掘技术正处在发展这3类软件各自的侧重点不同,适用范围和当中.数据挖掘涉及到数理统计、模糊理论、神经针对的用户也不相同.具备了这3种工具的数据网络和人工智能等多种技术,技术含量比较高,实仓库系统,才能真正高效地利用数据仓库中蕴藏现难度较大.此外,数据挖掘技术还会同可视化的大量宝贵的信息.技术、地理信息系统、统计分析系统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。