多核处理器的性能最优化设计

多核处理器的性能最优化设计

ID:13289791

大小:181.50 KB

页数:15页

时间:2018-07-21

多核处理器的性能最优化设计_第1页
多核处理器的性能最优化设计_第2页
多核处理器的性能最优化设计_第3页
多核处理器的性能最优化设计_第4页
多核处理器的性能最优化设计_第5页
资源描述:

《多核处理器的性能最优化设计》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、多核处理器的性能最优化设计:对于空间、能耗及同构异构型的讨论摘要:本篇论文综述了关于多核体系的芯片在设计上所考虑的各种因素以达到最高的性能。在设计多核处理器芯片上,空间、能耗、性能以及在芯片上各核之间的通讯都是必须考虑周到的东西。而在06年的一篇文章中更是提出用异构型的多核处理器的性能要比用通用处理器芯片组成的多核心处理器的性能要来得高【1】。当然,在设计一个芯片时,空间,能耗是首要考虑周到的问题。关键字:多核体系结构,计算机体系结构1引言随着计算机硬件技术的不断发展,多核处理器体系结构已经是最具

2、有吸引力和挑战性的领域。多核的处理器能够在保证了能耗以及复杂度的前提下,最大限度地提高系统的整体吞吐率。因此,当今的处理器体系结构设计的重点已经转移到了对多核心处理器芯片的设计上。如今已经有多种多核的处理器架构存在于市面上,如IBMPOWER4,POWER5,Intel的酷睿和AMD公司的架构。然后,对于这种日益增长的将N个核心放在一块芯片上的趋势,我们对于真正影响多核芯片的因素以及之间的联系却仍然不是非常的清楚。而事实上,影响多核体系结构设计的因素是各式各样成千上万的,比如说,我们得考虑我们的性

3、能输出,同时得考虑到面积的区域大小的限制,得考虑到由于核心过多导致的电量供给不足,以及带宽总线的数量产生的影响甚至于我们还得考虑到软件对多核处理器所带来的影响。因此,对于各种因素有个良好的分析以及对于总体性能影响而导致的主次之分的区别,对于整体设计而言是十分重要的。首先而言,能耗(电量)、区域大小限制、延时以及带宽是对于设计多核处理器的最重要的瓶颈因素,其设计方式以及采用的各种各样的参数直接影响了能够采用的核的数量,性能的高低及其他关键性的因素。其次而言就是处理核心的数量,缓存使用的形式,这几项是

4、影响总体性能的次要关键。而在处理核心数量和缓存这两个中,处理核心数又直接影响了面积的参数,当今比较流行的是双核的体系结构,现在intel实现了4核的处理器架构并且发布,事实上,SUN公司已经成功将8个核放在一个核心上了【6】,最近有证据显示,INTEL公司甚至有八十核的处理器,然后其功耗以及面积并非市面所见了,暂且不论。而缓存的使用方式对于性能的影响在许多论文中也有过探讨。现在,Intel的CoreDuo系列,IBM的power5系列以及SUN的Niagara系列都是采用的核上共享二级缓存的做法。

5、同样,一些使用单独的核心自带二级缓存的多核处理器也是存在的,其性能也是有差距的。事实上,增加处理核心的数量意味着增加核间总线以及对缓存或者其他共享设备的冲突。因此,在性能与能耗,性能与空间限制等一系列参数值中寻找到一个最好的折中点,是我们当前最该做好的事情。试验数据表明,对于多核处理器体系的未来设计而言,核间的内部联系或者共享将是一个巨大的挑战也是首要的设计要素。比如,在【2】中提到的8核心处理器在保守的情况下,其能耗只相当于一个单核处理器,而其面积等于三个核。不论核/缓存架构或者是内联的架构,都

6、是可以单独发展和单独设计的,而研究表明,最好的设计是综合考虑这二者。1相关知识首先,介绍一下在内联体系结构中的几个层次结构。SBF(共享总线结构)提供了一种到多个模块共享的连接,P2P(点对点连接)系统在一个多SBF系统中用来连接2个不同的SBF,最后一个层次结构就是纵横连接系统(crossbarinterconnectionsystem)。2.1共享总线结构这里首先介绍一下SBF的一些知识。SBF(共享总线结构)是一种用于连接CMP上处理器,缓存,I/O设备以及存储器的告诉连接线路。这种连接就相

7、当于是在多处理器架构中的探测总线那样的作用了。由于这种原因,SBF是一种复用线路,它必须提供多种传输协议,比如说请求、探测、响应、数据传输等等。又由于其在芯片上的巨大的传输距离以及巨大的线路等待延时,因此,SBF被设计成为是流水线方式以及单向方式。又正是由于这种定义,SBF总是成对出现的。下面介绍一下在SBF上比较典型的事务发生,我们假设所有的处理核心都拥有自己独立的1级和2级缓存,SBF连接的是所有的2级缓存。首先,一个在二级缓存上的load指令miss将导致这个指令进入SBF寻求帮助。一个处理

8、核心将请求发到中央仲裁器(centraladdressarbiter)告诉它有请求。当它通过其请求时,它将请求发送到一个地址总线上(addressbus)。请求将到达地址总线的末端并且置于探测队列的末尾,等待着进入探测总线(snoopbus)。当请求进入了探测总线后,将会使得每个位于探测总线末端的节点都将一个响应消息放在响应总线(responsebus)上。而在响应总线末端的逻辑部件将收集这些响应并且产生一个广播消息,这个广播消息通过响应总线回到所包括的每个节点并且告诉它所应该做的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。