计算机组成原理第五章 第6讲 流水CPU.ppt

计算机组成原理第五章 第6讲 流水CPU.ppt

ID:50734387

大小:429.00 KB

页数:23页

时间:2020-03-13

计算机组成原理第五章 第6讲 流水CPU.ppt_第1页
计算机组成原理第五章 第6讲 流水CPU.ppt_第2页
计算机组成原理第五章 第6讲 流水CPU.ppt_第3页
计算机组成原理第五章 第6讲 流水CPU.ppt_第4页
计算机组成原理第五章 第6讲 流水CPU.ppt_第5页
资源描述:

《计算机组成原理第五章 第6讲 流水CPU.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、流水CPU5.6流水CPU人们追求计算机有很高的处理速率促使计算机性能提高的因素除了提高器件性能外还有哪些方式呢??回顾存储器性能提升方法解决途径硬件工艺上的提升并行工作双端口访问和多模块交叉空间并行和时间并行采用分层的存储系统Cache(第6节)虚拟存储系统(第9章)5.6流水CPU5.6.1并行处理技术5.6.2流水CPU的结构5.6.3流水线中的主要问题5.6.4PentiumCPU5.6.1并行处理技术并行性(Parrelism)概念问题中具有可以同时进行运算或操作的特性例:在相同时延的

2、条件下,用n位运算器进行n位并行运算速度几乎是一位运算器进行n位串行运算的n倍(狭义)广义含义只要在同一时刻(同时性)或在同一时间间隔内(并发性)完成两种或两种以上性质相同或不同的工作,他们在时间上相互重叠,都体现了并行性。5.6.1并行处理技术三种形式时间并行(重叠):让多个处理过程在时间上相互错开,轮流使用同一套硬件设备的各个部件,以加快硬件周转而赢得速度,实现方式就是采用流水处理部件空间并行(资源重复):以数量取胜它能真正的体现同时性LSI和VLSI为其提供了技术保证时间+空间并行Pent

3、ium中采用了超标量流水技术5.6.2流水CPU的结构流水计算机的系统组成存储器体系:主存采用多体交叉存储器;Cache流水方式CPU:指令部件、指令队列、执行部件指令流水线指令队列:FIFO执行部件:可以由多个采用流水线方式构成的算术逻辑部件构成,可以将定点运算部件和浮点运算部件分开。第一个流水:多体交叉存储第二个流水:CPU流水第三个流水:运算器流水5.6.2流水CPU的结构流水线CPU时空图IF(InstructionFetch取指)ID(InstructionDecode指令译码)EX(

4、Execution执行)WB(WriteBack写回)5.6.2流水CPU的结构非流水线时空图5.6.2流水CPU的结构标量流水线时空图5.6.2流水CPU的结构超标量流水线时空图5.6.2流水CPU的结构超标量流水具有两条以上的指令流水线上图中流水线满载时,每一个时钟周期可以执行2条指令采用时间和空间并行技术PS.此时钟周期不同于彼“时钟周期”一个是流水理论中的概念一个是指令周期、CPU周期中的概念5.6.2流水CPU的结构流水线(Pipelining)的分类按种类分为指令流水线:指令步骤并行

5、算术流水线:运算步骤并行存储流水线:多体交叉并行访存处理机流水线(宏流水线):处理机级联5.6.3流水线中的主要问题流水瓶颈问题(流水线中有速度慢的段)再分成几个段用资源重复的方法也可以解决断流问题因为出现了相关冲突5.6.3流水线中的主要问题1.资源相关:多条指令进入流水线后在同一时钟周期内争用同一功能部件。解决办法:后边指令拖一拍再推进;或增设一个存储部件,指令数据分存。取指译码执行访存写回5.6.3流水线中的主要问题2.数据相关,看例子例:两条指令发生数据相关冲突RAW(ReadAfter

6、Write)写后读ADDR1,R2,R3R2+R3-->R1SUBR4,R1,R5R1-R5-->R4ANDR6,R1,R7R1^R7-->R6IDIDEXEXWB5.6.3流水线中的主要问题数据相关RAW(ReadAfterWrite)写后读后面指令用到前面指令所写的数据WAR(WriteAfterRead)读后写后面指令覆盖前面指令所读的单元WAW(WriteAfterWrite)写后写两条指令写同一个单元解决办法:可以推后后继指令对相关单元的读操作设置相关的直接通路(Forwarding)

7、5.6.3流水线中的主要问题3.控制相关引起原因:转移指令当前指令有跳转,但流水已经开启后续指令处理过程。解决办法1:延迟转移法,让跳转的指令接在最后流水入口解决方法2:转移预测法,用硬件预测将来的行为,提前让转移指令进流水。【例4】流水线中有三类数据相关冲突:写后读(RAW)相关;读后写(WAR)相关;写后写(WAW)相关。判断以下三组指令各存在哪种类型的数据相关。1)I1ADDR1,R2,R3;(R2)+(R3)->R1I2SUBR4,R1,R5;(R1)-(R5)->R42)I3STOM(

8、x),R3;(R3)->M(x)M(x)是存储器单元I4ADDR3,R4,R5;(R4)+(R5)->R33)I5MULR3,R1,R2;(R1)×(R2)->R3I6ADDR3,R4,R5;(R4)+(R5)->R3写后读读后写写后写解:第1)组指令中,I1指令运算结果应先写入R1,然后在I2指令中读出R1内容。由于I2指令进入流水线,变成I2指令在I1指令写入R1前就读出R1内容,发生RAW相关。第2)组指令中,I3指令应先读出R3内容并存入存储单元M(x),然后在I4指令中将运算结果写入R

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。