流水线技术-向量处理机

流水线技术-向量处理机

ID:46842583

大小:614.50 KB

页数:43页

时间:2019-11-28

流水线技术-向量处理机_第1页
流水线技术-向量处理机_第2页
流水线技术-向量处理机_第3页
流水线技术-向量处理机_第4页
流水线技术-向量处理机_第5页
资源描述:

《流水线技术-向量处理机》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、3.5向量处理机3.5.1向量处理方式和向量处理机◆向量处理机:具有向量数据表示和相应向量指令的流水线处理机。◆标量处理机:不具有向量数据表示和相应向量指令的处理机。D=A×(B+C)A、B、C、D──长度为N的向量1.向量处理方式第三章流水线技术虚拟存储器的特点(1)水平(横向)处理方式Ki=bi+ciDi=Ki×ai相关:N次功能切换:2N次虚拟存储器的特点(2)垂直(纵向)处理方式K=B+CD=K×A相关:1次功能切换:1次对处理机结构的要求:存储器-存储器型操作的运算流水线对存储器的带宽要求很高。例如:STAR-10

2、0,CYBER-2053.5向量处理机虚拟存储器的特点3.5向量处理机虚拟存储器的特点(3)分组(纵横)处理方式把向量分成长度为某个固定值的若干组, 组内按纵向方式处理,依次处理各组。每组内:相关:1次功能切换:2次3.5向量处理机虚拟存储器的特点3.5向量处理机虚拟存储器的特点对处理机结构的要求:寄存器-寄存器型操作的运算流水线。举例虚拟存储器的特点2.向量处理机的速度评价方法◆标量处理机:通常用每秒执行多少指令MIPS(MillionInstructionsPerSecond)来衡量机器的运算速度。◆向量处理机:常用每秒

3、取得多少个浮点运算 结果表示机器速度,以MFLOPS(Millionof FloatingPointPerSecond)作为测量单位。另一种评定计算机速度的方法:比较法。(选择一台速度指标得到公认的机器作为标准机,给定一些典型的基准程序。)3.5向量处理机虚拟存储器的特点3.5.2提高向量处理机性能的主要技术1.CRAY-I简介◆美国CRAY公司◆1976年◆每秒亿次浮点运算◆主频:80MHz字长:64位2.CRAY-1的基本结构◆向量运算部件:6个整数加,逻辑运算,移位浮点加,浮点乘,求倒数3.5向量处理机虚拟存储器的特点

4、◆向量寄存器组:8×64V0~V7◆每个Vi每个向量运算部件◆向量长度寄存器VL◆向量屏蔽寄存器VMCRAY-1向量处理的显著特点:只要不出现Vi冲突和向量功能部件冲突,各个Vi之间和各个向 量功能部件之间都能并行工作,大大加快了向量 指令的处理。3.5向量处理机虚拟存储器的特点3.CRAY-1向量指令类型◆Vk←ViopVj◆Vk←SiopVj◆Vk←主存◆主存←ViVi冲突:指的是并行工作的各向量指令的源向 量或结果向量的Vi有相同的。向量功能部件冲突:指同一个向量功能部件被 一条以上的并行工作向 量指令所使用。3.5向

5、量处理机虚拟存储器的特点3.5向量处理机虚拟存储器的特点4.链接技术当两条指令出现“写后读”相关时,若它们 不存在功能部件冲突和向量寄存器(源或目的)冲突,就有可能把它们所用的功能部件头尾相 接,形成一个链接流水线,进行流水处理。链接特性实质上是把流水线“定向”的思想 引入到向量执行过程的结果。3.5向量处理机虚拟存储器的特点虚拟存储器的特点例3.7对上述向量运算D=A*(B+C),若向量 长度N≤64,向量元素为浮点数,则在B、C取到V0、V1后,就可用以下三条向量指令求解:(1)V3←存储器(访存,载入A)(2)V2←V

6、0+V1(浮点加)(3)V4←V2*V3(浮点乘,存D)解:链接过程如图3.44所示:3.5向量处理机虚拟存储器的特点◆三条向量指令全部用串行方法执行,则总 的执行时间为:[(1+6+1)+N-1]+[(1+6+1)+N-1] +[(1+7+1)+N-1]=3N+22拍3.5向量处理机虚拟存储器的特点◆前两条向量指令并行执行之后,再执行第 三条向量指令,则总的执行时间为:[(1+6+1)+N-1]+[(1+7+1)+N-1] =2N+15拍◆采用向量链接技术,所需拍数(亦称为链接 流水线的流水时间)为:[(1+6+1)]+[

7、(1+7+1)]=17拍则三条向量指令总执行时间为:[(1+6+1)]+[(1+7+1)]+(N-1)=N+16拍3.5向量处理机虚拟存储器的特点5.向量链接的一些主要要求:(除了要保证无向量寄存器使用冲突和无向 量功能部件使用冲突的条件之外)◆在进行链接的时候,只有在前一条向量指令 的第一个结果元素送入结果向量寄存器的那 一个时钟周期才可以进行链接,若错过该时 刻就不能进行链接。◆只有当前一条向量指令全部执行完毕,释放 相应的向量寄存器资源后才能执行后面的向 量指令。3.5向量处理机虚拟存储器的特点◆当一条向量指令的两个源

8、操作数分别是两条 先行向量指令的结果寄存器时,要求先行的 两条向量指令产生运算结果的时间必须相等, 即要求有关向量功能部件的延迟时间相等。◆只有所有可以链接执行的向量指令的向量长 度相等时,它们之间才能链接执行,否则它 们之间也不能链接执行。3.5向量处理机6.向量循环或分段开采技术如果向

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。