《流水线CPU技术》PPT课件

《流水线CPU技术》PPT课件

ID:41235055

大小:2.10 MB

页数:85页

时间:2019-08-20

《流水线CPU技术》PPT课件_第1页
《流水线CPU技术》PPT课件_第2页
《流水线CPU技术》PPT课件_第3页
《流水线CPU技术》PPT课件_第4页
《流水线CPU技术》PPT课件_第5页
资源描述:

《《流水线CPU技术》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、5.7流水线CPU5.7.1并行性概念1.并行性的含义同时性——指两个或者两个以上事件在同一时刻发生。并发性——指两个或者两个以上事件在同一时间间隔内发生。5.7流水CPU5.5.2并行性概念2.并行处理技术的主要形式(1)时间并行—时间重叠让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件的各个部分,从而赢得高速度。实现方式:采用流水处理部件。(2)空间并行——资源重复例:奔腾CPU采用的超标量流水技术。用多个相同部件处理多个事件。实现方式:多处理器系统和多计算机系统或单处理器系统。(3)时间并行+空间并行既采用时间并行性又采用空间并行性。流

2、水线计算机的系统组成现代流水线计算机系统组成原理如左图所示。其中CPU按流水线方式组织,通常由三部分组成:指令部件、指令队列、执行部件。这三个功能部件可以组成一个3级流水线。图3.33流水线计算机系统组成原理示意图流水线CPU的结构指令流水线原理问题的提出串行执行方式存在部件利用率不高(有闲置时间)的问题。CPU周期使用部件闲置部件取指令PC,MS,IR等ALU,GRS取数MSPC,ALU,GRS执行ALU,GRSPC,MS每个过程段所用的部件不同在某个过程段时,其他过程段的部件处于空闲(2)流水线工作原理①指令周期的三个主要过程:图5.30指令周

3、期的三个过程段取数取指执行入出②指令执行过程的时空图a.非流水线时空图I1I1I1I2I2I2I3I3I3I1I2I3空间S时间T执行取数取指(a)非流水线时空图b.标量流水线时空图I1I1I1I2I2I2I3I3I3I4I4I4I1I2I3空间S时间T执行取数取指(b)标量流水线时空图I4图5.31非流水线与流水线对比c.超标量流水线时空图I1I3I5I2I4I6I1I3I5I7I2I4I6I8I1I3I5I7I9I2I4I6I8I10I1I2I3I4I5I6执行取数取指空间S时间T(C)超标量流水线时空图流水线vs非流水线①非流水线指令的执行是串

4、行的;②标量流水线从满载起,每经1个周期做完一条指令;③超标量流水线,提高了吞吐量,但需二套(或二套以上)流水线的硬件及其他电路。(见附图)常见的超标量流水线结构(3)流水线工作方式的特点①具有时间的并行性;②流水线分工越细,可同时运行的指令越多,吞吐率就越高。但需增加硬件,控制更复杂;③流水线每个阶段的执行时间应尽量一致;④流水线充满(满载)时达到最大的吞吐率。流水线相关问题流水线相关:是指邻近指令之间由于某种关系,出现了不能同时被流水操作的现象。流水线的相关会造成流水线的断流,影响整个流水线的效率。造成流水线相关的原因资源相关数据相关变址转移中断

5、全局性相关局部性相关局部性相关:资源相关在同一机器时钟周期内争用同一个功能部件所发生的冲突。时钟指令12345I1取指译码取数执行I2取指译码取数执行I3取指译码取数在时钟3发生争用内存的问题—资源相关。解决方法:①将取指操作推迟一个时钟进行;②增设一个存储器,将指令和数据分开存放;③采用双端口存储器。局部性相关:数据相关在程序中,一条指令的执行需等前一条指令执行完后才能进行,则有数据相关。例:取数译码取指ADD执行取数译码取指SUB4321时钟指令解决方法:①推迟ADD指令的取数操作;②采用数据旁路(内部向前)技术,直接把结果送给下一条指令。全局性

6、相关:控制相关由条件转移指令或中断引起的。解决方法:①延迟转移法:加入空操作,等待转移条件形成。②猜测法:选择出现概率较高的分支进行指令预取。【例4】流水线中有三类数据相关冲突:写后读相关;读后写相关;写后写相关。判断以下三组指令各存在哪种类型的数据相关。(1)I1:ADDR1,R2,R3;(R2)+(R3)->R1I2:SUBR4,R1,R5;(R1)-(R5)->R4(2)I3:STAM(x),R3;R3)->M(x),M(x)是存储器单元I4:ADDR3,R4,R5;(R4)+(R5)->R3(3)I5:MULR3,R1,R2;(R1)×(

7、R2)->R3I6:ADDR3,R4,R5;(R4)+(R5)->R3(1)I1:ADDR1,R2,R3;(R2)+(R3)->R1I2:SUBR4,R1,R5;(R1)-(R5)->R4第(1)组指令中,I1指令运算结果应先写入R1,然后在I2指令中读出R1内容。由于I2指令进入流水线,变成I2指令在I1指令写入R1前就读出R1内容,发生RAW(写后读)相关。局部性相关:数据相关(2)I3:STAM(x),R3;(R3)->M(x),M(x)是存储器单元I4:ADDR3,R4,R5;(R4)+(R5)->R3第(2)组指令中,I3指令应先读出R

8、3内容并存入存储单元M(x),然后在I4指令中将运算结果写入R3。但由于I4指令进入流水线,变成I4指令在I

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。