多核处理器cache一致性的优化论文综述

多核处理器cache一致性的优化论文综述

ID:13276287

大小:347.00 KB

页数:20页

时间:2018-07-21

多核处理器cache一致性的优化论文综述_第1页
多核处理器cache一致性的优化论文综述_第2页
多核处理器cache一致性的优化论文综述_第3页
多核处理器cache一致性的优化论文综述_第4页
多核处理器cache一致性的优化论文综述_第5页
资源描述:

《多核处理器cache一致性的优化论文综述》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、目录一、概述2二、详细描述31网络之内Cache一致性(In-NetworkCacheCoherence)31.1介绍31.2网络之内的Cache一致性算法51.3网络之内的Cache一致性实现61.4模拟结果71.5小结82多核处理器邻近感知基于目录协议的一致性82.1介绍82.2基于目录一致性的CMP架构82.3邻近感知一致性算法92.4分析与结果102.5小结113多核处理器的合作Caching123.1介绍123.2CMP合作Caching123.3硬件实现133.4结果143.5小结144CM

2、PCaches的自适应选择复制154.1介绍154.2ASR154.3利用SPR实现ASR164.4结果分析174.5小结18三、总结18四、参考文献1920多核处理器cache一致性的优化论文综述一、概述在多核处理器里,Cache的主要作用是caching,即在相关处理器的Caches中保留共享数据的copy。因此多处理器的Cache应提供两种功能:1)共享数据的迁移(migration):通过把共享数据移到本地Cache,并且利用在本地Cache的共享数据来达到降低访问共享数据的latency。2)

3、共享数据的复制(replication):指一旦某数据在某一Cache被改写后,应及时将改写值复制到其它Cache中去。保证多个处理器可同时读出共享数据。达到降低latency(远程调用)和减少对共享数据的竞争。在多核处理器共享数据迁移和复制的过程中,为了维护Cache的一致性,引进维护Cache一致性的协议,称为cache-coherenceprotocol。而实现Cache-coherenceprotocol的关键是:跟踪共享数据块的状态。当前主要存在两类protocols,对应两种不同的跟踪共享状

4、态的技术:基于目录的技术和监听技术。对多核处理器cache一致性的研究有很多,我们可以把他们大致地分为以下的三类:共同的协议和网络的优化(Jointprotocol-networkoptimizations),网络优化(Networkoptimizations),协议优化(Protocoloptimizations)。这三类的优化方法如下:1)共同的协议和网络的优化致力于cache一致性协议和网络的共同设计来达到提高cache一致性性能的目标。2)网络优化主要方向在设计更好的网络来简化cache一致性协

5、议来提高系统性能,比如说网络排序、多播等等。3)协议方面的优化致力优化读写数据的有序一致性,比如通过增加更多的状态,或者联合监听技术与基于目录的技术组成二级的网络等等。当前的对Cache一致性优化方面的研究还是集中在对协议的优化或者协议和网络的共同优化,通过对这方面的论文的精读与整理,让我对Cache一致性有了更加深刻的了解。在5篇精读文章里有4篇是关于Cache一致性优化的,还有一篇是关于构造性cache共享的调度算法的,在这篇综述里,我们将主要对4篇关于Cache一致性优化的文章做下重点阐述,并和其

6、它相关的Cache一致性算法坐下比较以及总结。这4篇关于Cache一致性优化的文章主要内容如下:1)网络之内Cache一致性(In-NetworkCacheCoherence)[1],在这篇文章里,它提出了一个在网络里cache一致性协议的一个实现,把目录嵌入在每一个路由节点里,管理相近数据的复制请求。实验表明该20的算法能够提高44.5到56%的平均内存访问延迟。1)多核处理器邻近感知基于目录协议的一致性(Proximity-awaredirectory-basedcoherenceformulti-

7、coreprocessorarchitectures)[2],在这篇文章里,它讨论了一种邻近感知的基于目录的一致性来减少不必要的内存和数据移动开销来提高多核处理器的性能。虽然在微处理器,所有的延迟的绝对值都很小,但是它们之间的相对延迟却很重要。当有读或者写数据的请求的是时候,我们并不总是从原始节点读取数据,而是从最近的节点读取数据。这可以减少延迟以及带宽的使用率。2)多核处理器的合作Caching(CooperativeCachingforChipMultiprocessors)[3],在这篇文章里,它

8、提出了合作的cache的方法,该方法使用一个集合的cache尽可能地把数据存放在L2cache,努力达到共享L2cache的等容量的效果;比如说我们把一个本地的冲突的块放在邻近一个有多余空间容量的L2cache。CMP合作的cache努力去建立一个全局管理的“共享”集合cache通过不同cache之间的合作,所以cache资源能够更适应不同应用程序的动态需求。3)CMPCaches的自适应选择复制(AdaptiveSelectiveRepl

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。