基于移动agent数据挖掘技术的研究

基于移动agent数据挖掘技术的研究

ID:32755827

大小:3.67 MB

页数:58页

时间:2019-02-15

基于移动agent数据挖掘技术的研究_第1页
基于移动agent数据挖掘技术的研究_第2页
基于移动agent数据挖掘技术的研究_第3页
基于移动agent数据挖掘技术的研究_第4页
基于移动agent数据挖掘技术的研究_第5页
资源描述:

《基于移动agent数据挖掘技术的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要计算机技术、网络技术、Internet技术的进步,带来了数据挖掘技术的迅速发展。该技术主要是以从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的、以及最终可理解的模式为目标,实现寻找模式的决策支持。实际工程中,数据集大部分都按地理位置分布于多个场所,若把这些数据重新收集到一个集中的地方(如数据仓库),这要求有高的数据通讯网络,并且会导致响应时间变长和数据私有性和安全性被破坏。分布式数据挖掘技术很好地解决了以上的问题,在分布式数据挖掘系统下,用户、数据、硬件资源以及挖掘需要的软件资源在物理上都可以使分布的。为了提高分布式

2、数据挖掘系统的通信效率、平台兼容性并解决数据传输等方面存在的安全性问题,本论文围绕研究将移动Agent技术应用到分布式数据挖掘中,构建远程交互、平台无关、节约网络带宽且具有较高可维护性和灵活性的分布式数据挖掘系统,以重庆交通大学研究生教育创新基金项目“网络工程系统‘亚健康’状态诊断及智能维护决策机制研究”为背景,对移动Agent技术在分布式数据挖掘方面的应用进行了深入的研究与讨论。论文主要研究成果包括:(1)对移动Agent做了深入的理解和掌握,深入分析了移动Agent模型的特征、系统结构等。剖析了其它一些分布式计算模型的优缺点,在此基础上提出了一个基于

3、移动Agent的分布式数据挖掘模型。在分析影响分布式数据挖掘性能的因素的基础上,建立了几种典型的分布式数据挖掘模型的通信代价模型。(2)利用移动Agent平台Aglet,设计并实现一个基于Aglet的分布式数据挖掘原型系统,该系统利用移动Agent的移动性、反应性、自主性等特征,主控站点派遣Aglet迁徙到远程站点去执行挖掘任务,并将局部挖掘结果返回主控站点。只须移动的仅仅是Aglet本身少量的代码、局部挖掘结果和Aglet本身的状态,减少了通信量。(3)在研究了关联规则挖掘理论和各种分布式关联规则挖掘算法的基础上,对分布式关联规则挖掘算法FDM算法进行

4、了改进,得出了DDMARBA算法。该算法中,由于移动Agent的介入,彻底改变了分布式环境中各站点间的通信方式,理论分析表明,A西et只需两次往返于主控站点和目的主机之间(两次往返的Aglet是具有不同挖掘任务的Aglet),即可得到远程站点的局部挖掘结果,提高了挖掘效率。对UCI数据集,运用该算法进行实验,证明了DDMARBA算法的有效性和较之Aprior算法的挖掘效率的优势,特别是对于海量数据集来说,挖掘效率优势愈加明显。关键词:数据挖掘;移动Agent:Aglet平台;数据库;关联规则ABSTRACTWiththedevelopmentofcomp

5、utertechnology,networktechnologyandIntemette(!hnology’thetechnologyofdatamininghasdevelopedrapidly.Thistechnologyisengagedinidentifyingthemodewhichisvalid,novel,potentiallyusefulandultimatelycomprehensiblefromlarge,incomplete,noisy,fuzzyandstochasticdatasets,andachievesfindingdec

6、ision-makingsupportofmode.Inpractice,mostdatasetsdistributegeographicallyinseverallocations,therefore,ifthedataisproposedtobecollectedinoneplace(suchasdatawarehouse),high—speedcommunicationnetworkwillberequired.asaresult,timeofresponsewillbelongerandsecuritywillbedestroyed·Howeve

7、r.technologyofdistributeddataminingresolvestheaboveproblemswellandindistributeddataminingsystem,client,data,hardwareandsofhvareneededbydataminingcanbedistributedgeographically.Inordertoimprovethecommunicationefficiencyandplatformcompatibilityofdis仃ibuteddataminingandsolvethesecur

8、ityproblemsexistinginthefieldsofdatatraI

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。