基于ap算法的社区检测算法及其并行化研究

基于ap算法的社区检测算法及其并行化研究

ID:35105728

大小:7.35 MB

页数:82页

时间:2019-03-18

基于ap算法的社区检测算法及其并行化研究_第1页
基于ap算法的社区检测算法及其并行化研究_第2页
基于ap算法的社区检测算法及其并行化研究_第3页
基于ap算法的社区检测算法及其并行化研究_第4页
基于ap算法的社区检测算法及其并行化研究_第5页
资源描述:

《基于ap算法的社区检测算法及其并行化研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、^I'm3Ulfl^4i钟成A香1^',UNIVERSITYOFELECTRONICSCIENCEAHDTECHKOLOGYOFCHIMA.硕±学位论文IMASTERTHESIS/^I,3^.\iI/y%狂Y画f论文题旨基于AP算法的社區检测算法及其并学科专业计算机应用技术201321060424学号作者谜名__—吕晨陋指學教师杨波教授_'EW::^SB-I'-rr,.独创性声明本人声明所呈交的学位论文

2、是本人在导师指导下进行的研究工作1和致谢的地方及取得的研究成果。据我所知,除了文中特别加:^标注夕h,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表不谢意。巧^曰作者签名:三。3曰期货化年6月歹_私_论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁蟲,允许论文被查阅和借阅。本人授权电子科技大学可将学位论文的全部或部容编入数索可

3、臥采影、缩印或扫描分内有关据库进行检,用印等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵)守此规定。:导签作者签名知争名:师木^:年月曰曰期2/占分类号密级注1UDCAP(题名和副题名)(作者姓名)指导教师杨(姓名、职称、单位名称)申请学位级别学科专业提交论文日期2016.3.28论文答辩日期2016.5.16学位授予单位和日期20166答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。ResearchofCommunityDetectionAlgorithmbasedonAffinityPropagationandItsParalleiz

4、ationAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:ComputerAppliedTechnologyAuthor:ChenyangLvSupervisor:Prof.BoYangSchool:SchoolofComputerScience&Engineering摘要摘要现实生活中很多系统结构都能抽象成网络,比如关系网络、新陈代谢网络、电子邮件通信网络、移动电话网络等。这些网络能够根据内部的相互作用表现出某些结构特征,其中社区结构(CommunityStructure)是

5、这类网络中一个重要的特征,对网络中的社区结构的进行检测的方法叫做社区检测(CommunityDetection)。社区检测作为网络分析的基本任务有助于其它网络计算任务的完成,近年来有很多针对社区检测的研究并取得了不少研究成果。科学技术的不断进步使得网络的规模不断增大,现有的部分社区检测算法已经不能胜任大规模网络的社区检测任务。另外,社区检测问题能够转化为聚类问题,所以本文主要从相似性算法、聚类算法和分布式并行化计算三个方面入手对社区检测问题进行研究,本文的主要内容如下:1.在现有的一些针对网络中顶点之间相似性进行计算的算法研究中,大多数算法要么时间复杂度过高,要么没有充分的考虑整个网络

6、的拓扑结构。基于以上问题,本文以随机游走模型为基础并基于个性化排名算法APR(ApproximatePageRank)算法,提出了一种快速的相似性计算算法,使得该算法在充分考虑网络的拓扑情况下提高网络中顶点之间相似性计算的效率。2.在社区检测的聚类阶段,现有的一些聚类算法不能够充分的利用网络中所蕴含的信息使得检测出来的社区质量不高。基于以上问题,本文提出了一种适用于针对网络进行社区检测的半监督聚类算法SSAP(SimilaritySetbasedAffinityPropagation),该算法是基于AP(AffinityPropagation)算法的一种改进,提高了聚类算法在迭代时的运

7、行效率以及整个算法的收敛速度。并结合提出的相似性计算方法,把社区检测问题转化成为了聚类问题。3.随着分布式计算的技术越来越成熟,比如基于Hadoop平台的MapReduce并行化计算框架、基于内存模型的并行化计算框架Spark等。这些分布式计算技术的出现使得先前不能在单机环境下完成的计算任务得以实现。同时,在社区检测任务中,由于面临的网络规模越来越庞大,至此,本文在Spark框架下对所提出的社区检测算法进行了并行化实现,利用分布式并行化的优势使

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。