数据挖掘领域本体模型的研究

数据挖掘领域本体模型的研究

ID:36631107

大小:532.76 KB

页数:9页

时间:2019-05-13

数据挖掘领域本体模型的研究_第1页
数据挖掘领域本体模型的研究_第2页
数据挖掘领域本体模型的研究_第3页
数据挖掘领域本体模型的研究_第4页
数据挖掘领域本体模型的研究_第5页
资源描述:

《数据挖掘领域本体模型的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、http://www.paper.edu.cn数据挖掘领域本体模型的研究郑亮,李学明1重庆大学计算机学院,重庆(400044)E-mail:zhengliang9966@163.com摘要:数据挖掘是当前计算机科学研究的活跃领域。该领域知识的不断扩充和更新,使得数据挖掘工作者在实施数据挖掘时,对众多的领域知识进行选择使用上存在困难。为了协助数据挖掘工作者的工作,本研究将本体理论引入到数据挖掘领域知识管理中,通过使用本体构建工具Protégé作为平台,提出了一个开放的、可扩充的数据挖掘知识管理协助

2、系统。本文对数据挖掘领域知识本体模型的研究做了重点阐述,包括数据挖掘本体的构建和使用PAL语言来实现知识概念的简单推论。关键字:数据挖掘,本体论,Protégé中图分类号:TP3911.引言在数据爆炸但知识贫乏的时代,人们希望能够对数据进行更高层次的分析,以便更好的利用这些数据,数据挖掘技术应运而生。数据挖掘(DataMining)在1989年8月举行的第11届国际联合人工智能学术会议上提出后,对其的研究便成为热点。数据挖掘的目标主要是为了帮助决策者寻找数据间潜在的关联、特征、趋势等,对预测未来

3、和决策行为十分有用,因而得到广泛地应用。随着数据挖掘技术在商业领域中得到越来越广泛的应用,国内外的研究学者都从不同的角度来对数据挖掘技术和系统进行大量的研究,使得数据挖掘领域知识不断的扩充和更新。通过对数据挖掘领域知识加以分析和研究,我们在实际数据挖掘应用时存在以下几个方面主要问题:1、数据挖掘知识的多样性和复杂性。知识的多样性包括挖掘方法的多样性、挖掘算法的多样性等。复杂性包括被挖掘的数据集的数据结构化程度的复杂性,挖掘的应用领域的复杂性等等。2、数据挖掘知识概念间的隐性关联,如:不同的数据挖

4、掘任务对应不同的数据挖掘方法;不同结构的数据集的所对应的数据挖掘算法也不同等等……。3、领域专有术语不统一。所以对数据挖掘领域知识(例如:众多的算法和方法等)进行总结、归纳和分类是有必要的,从而可以协助数据挖掘工作者在实施数据挖掘过程。基于上述的原因,本研究将本体的概念引入数据挖掘领域知识的研究中。本体(Ontology)最早是一个哲学上的概念。从哲学的范畴来说,Ontology是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。在人工智能界,最早给出Ontology定义的是Neche

5、s等人,[1]他们将Ontology定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。1993年,Gruber给出了Ontology的一个最为流行[2][3][4]的定义,即“Ontology是概念模型的明确的规范说明”。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。而领域本体(DomainOntology)是专业性的本体,提

6、供了某个专业学科领域中概念的词表以及概念间的关系,或在该领域里占主导地位的理论。由于本体概念模型具有明确性、共享性和重用性等性质,本体在计算机的许多领域也得到了广泛的应用,如:知识工程、数字图书馆、软件复用、信息检索和Web上异构信息的处[5][6]理、语义Web等。所以将本体的理论引入数据挖掘研究领域知识,解决数据挖掘领域中的问题是十分有益的。本研究基于本体论提出了构建一个开放的、可扩充的数据挖掘知识管理协助系统模型。-1-http://www.paper.edu.cn[7][8][9]我们对

7、已经存在并被证明是有效的数据挖掘知识进行分析,结合现有的研究成果,得[10]出需要的数据挖掘领域本体。再运用本体建模工具Protégé建立本体库,利用Protégé的可[11]扩充性,当有新的知识时,运用该工具将新本体补充到本体库中,从而协助数据挖掘工作者在实施数据挖掘过程中对众多的数据挖掘领域知识(如:众多的方法和算法等)进行查询、选择合适的知识。2.数据挖掘知识管理协助系统[10][11][12]本研究利用Protégé、PAL(ProtégéAxiomLanguage)推论模块及推理机来建

8、立一个开放的、可扩充的数据挖掘知识管理协助系统模型,用以解决前述数据挖掘知识管理问题:领域知识的多样性和复杂性、概念间隐性关联及领域专有术语不统一。整个系统的架构如图1所示,共分成Protégé3.2、PAL推论模组、QueryTab查询模块、推理机、使用者查询接口、知识库维护接口、DM元数据库及DM本体库八个模块。下面首先介绍系统模块工作过程,然后分别介绍各部分模块的主要功能。图1数据挖掘知识管理协助系统模型2.1系统功能简述首先,由知识工作者先将DM领域知识进行分析归类、确定各类间相互的关系

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。