基于多层次数据库的智能web挖掘系统

基于多层次数据库的智能web挖掘系统

ID:33540267

大小:220.81 KB

页数:3页

时间:2019-02-27

基于多层次数据库的智能web挖掘系统_第1页
基于多层次数据库的智能web挖掘系统_第2页
基于多层次数据库的智能web挖掘系统_第3页
资源描述:

《基于多层次数据库的智能web挖掘系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第30卷第5期计算机工程2004年3月VoL30抽5ComputerEngineeringMarch2004。软件技术与数据库·文t幼号:1000-3428(2004)05-01193-02文臼标识码:^中目分纽号。TP3,3基于多层次数据库的智能Web挖掘系统李长河,王谁花,张二虎(西安理工大学计算机学院,西安710048)摘耍:从当前Web挖掘的现状出发,提出了菇于知识利用的智能检索综合Web挖掘引攀系统IWMES井葬于IWMES阐述了多层关系数据库的概念,提出r实现〔终WebMl.(Web挖掘语言)设想方案与模型实例关性侧:

2、数据挖拥智能检索;多层次数据库;Web1$Ii语言;Web挖掘IntelligentWebMiningSystemBasedonMLDBLIChanghe,WANGWeihua,MANGErhu[Abstract]ThisarticleadvancesthesystemmodelofIWMES(IntelligentWebMiningEngineSystem)onthebasisofknowledgeutilimtion,andhaledonIWMES,itdiscussestheconceptofMLDBmidmakesoutc

3、onceivingschemeandmodelinstanceofimplementingmeans-WebML[Kevwords]Dammining(DM);Intelliircntsearch;Multiplelaversdatabase(MLDB):WebML;Webminine1IWMES系统模型IWMES的最终目的就是融合内容挖掘和结构挖掘功能为一体,解决随机的、动态的、不完全的或棍饨数据的数据LA丫ER,LAYER=挖掘,即实现所谓的科能数据挖桐.吹补抑去川妙的劫劫茉足_1oMLIJB1.1IWMES结构IWMES系统

4、模型上要有数据采集器、索引库、预处理器、挖掘综合器、抢掘方脚车和维护系统、用户输出评估界而和多层数据库7大部分组成,具体结构如图1所示。D,W来IR,(])数据采集器。按用户要求从网上采集数据,并将其存入文本数据库中。主要数据途径有MLDB和搜索引攀。(2)索引库。用来存放访问频率比较高的页面信息,主要包括相关关锤词信息、地址和内容等。其主要目的就是为了提高系统效率,作用类似于Cache,索引14'(3)预处理器。1WMES仍然使用传统的挖掘工具,将文本CUBE数据库中的HTML文档和XML文档组织成传统的挖掘工具可用的数据格式,

5、预处理器则是对文本数据库中的数据进行分类、提取并生成数据立方、数据库或数据文件等数据形式。挖}11k'j';合器(4)挖掘综合器。挖掘综合器是一个挖掘W动引擎。它根据挖掘要求和挖掘方法来选择策略,从挖掘方法库中选择,jJ砂一1果维合适的挖掘算法,并使用该方法去执行挖掘任务。关联规则1皿要页面护(5)挖掘方法库和维护系统。挖蒯方法库存放着各种挖:茬掘方法,如料lull-k.专家Zf#'.人1;i}14b}}=rM收;la[i:m14趋M)U势OM对M1侧}N111M其AAO他MW知朋NH系统法、网格计算等算法和解冷If*:ifW#t

6、iEitJa:};rn,ISAnf石川占}h51,n4f.-t.-a七fdtlf5二(b)用户输出与评估界而。将挖掘结果以直观友好的方川户输出、日气占界而式提交给用户,用户对挖掘结果进行评估,如果满意则挖掘过目Iwob拍翻均合双旅(SWMS)程结束,如果用户对挖掘结果不满意,则可以重提挖掘要求,再选择新的方法重新进行挖掘。项目签金:教育部重点实验室墓金资助项目((TKLI0107);陕西省教()多层数据库(MLDB)。其概念就是根据经常出现的基金资助项目(021K093)查询模式,}WebY的原始信急进行概括归纳,形成多层次作者钧

7、介:李长何(、9as-),男,教授,主研方向计算机视觉结构化的数据库,它是此系统模型中对于Web数据进行统一与多媒体信息处理,人工智能、机器人及网络计算新技术;王维花,硕士生;张二虎,在职博士生管理和共享的重要组织形式,直接影响到系统的性能。收鹅日抽:2003-03-31E-mail:chlmaila163.cgn-g3_万方数据1.2IWMES系统的实现关系表等。各站点通过各种转换工具,形成自己的LAYER,作为一个系统,各个儿素之问是相互联系协同工作的。数据库,这些数据库通过Internet构成了一个巨大的全局用户首先通过用户

8、输入界而翰入自己的挖掘要求,包括挖烟LAYER,数据库,虽然可以在LAYER,数据库上完成查询,但哪类网页,希望进行哪些挖掘操作等。一方面从索引库中检对于涉及大量站点的查询,其效率是低一「的,因此,要抽象索信息,如果存在相关数据,则直接从索引库中提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。