基于数据流模型的模糊聚类

基于数据流模型的模糊聚类

ID:36750321

大小:654.29 KB

页数:6页

时间:2019-05-14

基于数据流模型的模糊聚类_第1页
基于数据流模型的模糊聚类_第2页
基于数据流模型的模糊聚类_第3页
基于数据流模型的模糊聚类_第4页
基于数据流模型的模糊聚类_第5页
资源描述:

《基于数据流模型的模糊聚类》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、1242010,46(33)ComputerEngineeringandApplications计算机工程与应用基于数据流模型的模糊聚类张博,陈光,王旭ZHANGBo,CHENGuang,WANGXu东华大学信息科学与技术学院,上海201620CollegeofInformationScienceandTechnology,DonghuaUniversity,Shanghai201620,ChinaZHANGBo,CHENGuang,WANGXu.Fuzzyclusteringalgorithmfordata

2、stream.ComputerEngineeringandApplica-tions,2010,46(33):124-126.Abstract:FCMisanimportantclusteringalgorithm.Thoughalreadylotsofclusteringalgorithmsfordatastreamhavebeenpresented,theyallbelongtohardclustering.Therearenotfuzzyclusteringalgorithmsondatasetstil

3、lnow.Fuzzyclusteringalgorithmispresentlynotused.Aweightedfuzzyalgorithmforclusteringdatastreamisbroughtforward.Empiricalevidenceofthisalgorithm’ssuperiorityoverthecommonFCMalgorithmsontherealdatasetsandthesyntheticdatasetsisgiven.Keywords:datastream;fuzzyC-

4、means;cluster;weightedfuzzyC-means摘要:模糊聚类是数据挖掘中一个重要聚类算法。当前,基于数据流模型的聚类算法已有了广泛的研究,但这些算法均为硬聚类,尚未见数据流上进行模糊聚类的文献。提出一种针对数据流模型的加权模糊聚类算法,基于真实数据集合和人工数据集的实验表明该算法比传统的模糊聚类算法具有更好的聚类性能。关键词:数据流;模糊C-均值;聚类;加权模糊C-均值DOI:10.3778/j.issn.1002-8331.2010.33.035文章编号:1002-8331(2010)

5、33-0124-03文献标识码:A中图分类号:TP3911引言的隶属关系,FCM算法描述如下:nc近年来,数据流作为一类重要的数据来源受到学术界和22目标函数:J(Uv)=åå(uik)(dik)(1)业界越来越多的关注,基于数据流模型的数据挖掘算法已成k=1i=1为重要的研究课题。所说的数据流是指数据量潜在的无限U和v按下式计算:1大、到达速率不确定、只能单遍扫描的数据集,数据流的处理uik=cd(2)ik2只能在有限的内存和有限的时间内完成,这使得面向数据流å()dj=1jk的数据挖掘算法面临着更高的技

6、术要求。n2聚类分析是数据挖掘的一个重要内容,基于数据流模型的å(uik)xkk=1[1-6][7-11]v=(3)聚类算法已有了广泛的研究。模糊C-means算法(FCM)in2及其改进算法[12-15]作为一种重要的聚类方法已在模式识别、数å(uik)k=1据挖掘等领域广为使用,但据所知,目前数据流上的聚类算法c其中,å(uik)=11£k£n,dik=

7、

8、xk-vi

9、

10、为样本xk与簇中心vi均为硬聚类,尚未见数据流上进行模糊聚类的文献。i=1分析了基于数据流模型的模糊聚类问题,并提出一种加的欧氏距离,

11、u³0,1£i£c,1£k£n。ik权的模糊C-means聚类算法streamFCM,在真实数据集For-FCM算法通过迭代来获得簇中心v和隶属矩阵U,步骤iestCovertype和人工数据上的性能测试实验表明该算法具有如下:比FCM算法更好的聚类效果。步骤1初始化隶属矩阵U,u从(01)中随机取值,并满ikc足å(uik)=11£k£n;2FCM算法i=1设数据集X={x1x2xn},FCM算法就是要将X划分为步骤2通过公式(3)计算得c个模糊簇中心vi,i=1c个模糊簇并找到各个簇的簇中心

12、使得相异度代价(目标函2c;数)最小或低于某个阈值,FCM算法分析每个点对于各个簇步骤3通过公式(1)计算目标函数值。当目标函数值已基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.60672026)。作者简介:张博(1987-),女,硕士,研究方向为智能控制,网络通信等;陈光,教授,研究方向为无线通信领域

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。