基于图模型的高效聚类算法研究

基于图模型的高效聚类算法研究

ID:35106138

大小:7.40 MB

页数:65页

时间:2019-03-18

基于图模型的高效聚类算法研究_第1页
基于图模型的高效聚类算法研究_第2页
基于图模型的高效聚类算法研究_第3页
基于图模型的高效聚类算法研究_第4页
基于图模型的高效聚类算法研究_第5页
资源描述:

《基于图模型的高效聚类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代硬10004密级:公开如《猶9BEIJINGJIAOTONGUNIVERSITY硕±学位论文3崖I曲圓I基于!a模型自搞臟鐵渐賊Hll^^作者姓名牛品寂学科专业计算机科学与技术指导教师徐保民副教授‘!:培养院系计龍与信息技术学踪.&a.■欄.'?’'’-、A--.MM灌gr-J;r二,4^年s月韦IM主|硕壬学位论文基于图模型的高效聚类算法研究ResearchonCluskrinAlorithmBasedonGrahModelggp作者:牛品寂导师:徐保民北京交通大

2、学2016年3月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可W将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编W供查阅和借阅。同意学校向国家有关部口或机构送交论文的复印件和磁盘。学校可W为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名导师签名:/签字日期:年月日签字日期:年月;日A>^,^^学校代码:10004密级:公开北京交通大学硕±学位论文基于

3、图模型的高效聚类算法研究ResearchonClusterinAlorithmBasedonGrahModelggp13120416:牛品寂学号作者姓名:导师姓名:徐保民职称:副教授:学位类别:工学学位级别硕±学科专业:计算机科学与技术研究方向:数据挖掘北京交通大学2016年3月i致谢一段落,在毕业论文即将完时间飞逝,转眼间H年的研究生学习生涯即将告,由衷的对曾经帮助过我的人表示感谢成之际。、,本文是在徐老师得悉屯教导下完成的,首先,我要感谢我的导师徐保民教授,,,徐老师认真负责自研究生入学W来,我有幸师从徐保民老师

4、在学术上对待一,丝不苟,,给予我很多指导和鼓励问题,学术态度严谨学识渊博在徐老师的悉也指导下,我不仅获得了丰富的专化知识,更多的是掌握了正确的学习方法、、感谢H年来徐严谨的工作态度,使我终生受益,在此衷屯、脚踏实地的做人道理保民老师对我的关也和指导。一2班所有同学们我还要感谢这H年同陪伴我走过的计科,谢谢你们在学习一一和生活中给予我的帮助,让我收获了份难得的友谊,这也将成为我生中最宝,我们都从不同的地,我要感谢曲晓雅贵的财富。特别的、秦艳菲、宋晓莉同学,谢谢你们在生活上给予我的帮助方来的北京,来到交大,共同学习和生活。感谢戴昕同学王年的同窗之谊,谢谢你在学术

5、和论文撰写工作中给予我的启发和帮助。一一、直是我求学直支持,你们最后,我要感谢、鼓励、关屯、理解我的家人一一路上奋斗的动为和依靠直追求自己的梦想,我定会坚持。是你们的信任让我梦想,不辜负你们的期望。北京交通大学硕±学位论文摘要摘要近年来,随着社会网络、通信网络、生物网络等在各领域应用的快速发展,其产生的图模型数据更是呈现出快速增长的态势一。图作为种数据结构具有本身一其特有的表示方法和信息,个图模型可能包含几百到几百万的顶点,而这些顶点及其连接的边构成的关联信息在不同领域中都具有不同的意义,随着数据规模的不断增长,如何有效的对这些信息进行综合分析并从

6、中获取有用的信息进行应一用,是非常必要的,也是本文研究的主要的方向。聚类分析作为机器学习的个重要工具目前己经被广泛应用于文本挖掘、生物信息学、模式识别等领域的科学一研巧,随着图模型数据的广泛应用类较为重要的聚类分析方,图聚类也成为了一法,图聚类是图数据分析的有效技术之。在构造节点的相似矩阵时经常采用距离作为评价标准,而节点间存在多条等长路径及k短路径,这些路径间的关系都会对节点间相似性产生影响,因此综合考虑节点间的距离关系有助于更好的衡量节点间的相似性一。针对这问题,本文提出一个基于前k短路径的图聚类算法(DRGC),该算法参照谱聚类算法的思想,使用前k短路

7、径模型构造相似矩阵,利用多层自动编码器代替谱聚类算法中的特征分解实现对数据的重构,并且可W大大减少特征分解所用时间,最后利用非参数贝叶斯模型进行聚类,因狄利克雷过程具有很好的聚类性质并且可W实现对数据的自动划分,因此该算法可W在不预先指定聚类数目的情况下得到数据集的正确合理划分。一一为了克服单聚类算法对数据集敏感的问题,本文提出了个基于多数投票的聚类集成算法,该算法利用前k

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。