基于数据仓库与数据挖掘技术的信息检索体系

基于数据仓库与数据挖掘技术的信息检索体系

ID:38131482

大小:259.53 KB

页数:3页

时间:2019-05-25

基于数据仓库与数据挖掘技术的信息检索体系_第1页
基于数据仓库与数据挖掘技术的信息检索体系_第2页
基于数据仓库与数据挖掘技术的信息检索体系_第3页
资源描述:

《基于数据仓库与数据挖掘技术的信息检索体系》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第27卷第121期高校图书馆工作2以刀年第5期【数字图书馆专栏】编者按:伴随着现代数字网络技术的发展.数字图书馆的发展也日新月异。给传统的图书馆工作注入了强劲的动力同时也带来诸多需要解决的问题。为深入探讨数字图书馆的发展及应用,我刊本期推出数字图书馆专栏虽知此,还望得到方家的继续支持。基于数据仓库与数据挖掘技术的信息检索体系.张建中陈松乔方正(中南、李长沙41二3)〔摘要」文章重点介绍了数据仓库与数据挖握的基本概念、关健技术、主要研究领城和实现的具体步骤,同时提出了在信息检索系统中应用的领域和技术

2、研究的关健点。参考文故3o〔关键词]数据仓库数据挖掘信息检索〔中图法分类号」G250.76信息以“爆炸”性方式增长,使得人们获取准联机分析处理(OLAP)系统。确、可靠的有用信息越来越难,特别是获取为决策数据仓库和0以P工具基于多维数据模型。该提供依据的知识更难,而数据仓库与数据挖掘技术模型将数据看作数据立方体(山妞。ube)形式,数在科技信息检索中的应用具有广阔的前景。据立方体采用n一维分层数据建模,数据挖掘就是1数据仓库在多个抽象层上进行交互挖掘。例如,我们将四个1.1概念重点学科创建一个数据

3、仓库(Website),定期分析广义上讲,数据仓库是一种语义上一致的数据提供相关学科重要网站的学科信息,该数据仓库记存储,它充当决策支待数据模型的物理实现,并存录网站的用户访问量,它涉及维学科名称、各网站放企业战略决策所需信息。数据仓库也常常被看作的学科相关信息(Keylnft.)和时间段(tilne)。每一一种体系结构,通过将异种数据源中的数据集成在个维都与一个表与之关联。该表称为维表,它进一一起而构造,支持结构化的和专门的查询、分析报步描述维。告和决策制定。狭义上讲,数据仓库是一个面向主,点学

4、科网站访问t按照维A、B、C、D的三维视图题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程川。这个简短而又全面的定义SU印ECrl叨田EC几阳印1无nSU娜以兀月日(地质工程)(采矿工程)〔粉末冶金)(材料工程)指出了数据库的主要特征。四个关键词,面向主题同^国日DA国CDA一国国0A国日国的、集成的、时变的、非易失的,将数据仓库与其国1巴夕l湘145,1。一}1。一}1,1【绍!执1:1:一}】,:一},。1,,一}1二一}1。一}1,同它数据存储系统(如关系数据库系统、事物处理系

5、国l恻1〕::一l劲13121哪}}1,】川!。,一}1,一}1,1‘11另!龙21咖1叹。。1一同统和文件系统)相区别。1.2数据仓库的多维数据模型结构[l]通常我们都非常熟悉关系数据库(二维的),共中:QI、毋、Q3、甲介别表录一平度、二率度、三李度和四李度;几:表示电于丈改关月站;8:表示枚术共网站:C:表示令利与友明奥将关系数据库与数据仓库进行比较,就容易理解数月站;D.表示攀术动击奥网站:据仓库的多维体系结构。联机操作数据库系统主要表申的狡字表示在灰时翔在谊李科该奥网站访日的次盘。任务是

6、执行联机事物和查询处理。这种系统称为联由该三维表构建三维数据立方体,见图1:机事物处理(OLTP)系统,而数据仓库系统在数1.3数据仓库构建步骤据分析和决策方面为用户提供决策依据,这种系统从软件工程观点,数据仓库的设计和构造包含可以用不同的格式组织和提供数据,这种系统称为以下步骤:规划、需求研究、间题分析、仓库设万方数据第27卷第121期高校图书馆工作2侧刀年第5期计、数据集成和测试、部署数据仓库。成倍增长,需要采用一种有效工具来利用这些数据为人们提供所需知识和决策分析,而数据挖掘这种技术可以满足

7、这种需求。2.1极念I二{二一数据挖掘是从存放在数据库、数据仓库或其它匾反瓜勺引2信息库中的大量数据中挖掘有趣知识的过程。也有l二「‘压二}区何阿)M吕人称其为数据库中的知识发现或KDD。典型的数^皿CD据挖掘系统包含以下主要成分:数据库、数据仓库或其它信息库;数据库或数据仓库服务器;知识图1三维数据立方体库;数据挖掘引擎;模式评估模块;图形用户界1.4数据仓库的组成面。数据挖掘可以在任何类型的信息存储上进行。数据仓库一般有五个功能部分组成:数据源的例如关系数据库、数据仓库、事务数库、展开文件确定

8、与采集、数据的转换、数据的装人与存储、数和WW研1系统。据的查询与分析、元数据(Meta一Data)。元数据2.2主要毅据挖秘的方法阁是关于数据的数据,是定义数据仓库的对象,是数分类和预测:第一步是建立一个模型,描述预据仓库的基础。它包括了所有数据的有效性、取值定的数据类集或概念集。第二步是使用模型进行分范围、生成方式、以及从业务系统转化为数据仓库类。预测是构造和使用模型评估无标号样本类.或的规则等。总之,它在数据仓库中扮演重要角色,评估给定样本可能具有的属性值或值区间。元数据应当

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。