高等计算机系统结构教学教材.ppt

高等计算机系统结构教学教材.ppt

ID:60130619

大小:798.00 KB

页数:60页

时间:2020-12-03

高等计算机系统结构教学教材.ppt_第1页
高等计算机系统结构教学教材.ppt_第2页
高等计算机系统结构教学教材.ppt_第3页
高等计算机系统结构教学教材.ppt_第4页
高等计算机系统结构教学教材.ppt_第5页
资源描述:

《高等计算机系统结构教学教材.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、高等计算机系统结构削减处理器-存储器性能差距处理器面积比晶体管数比(成本)(功率)Alpha2116437%77%StrongArmSA11061%94%PentiumPro64%88%每个封装体两个2芯片(dies):Proc/I$/D$+L2$Cache本身并没有特殊的内在意义,它仅是缩小处理器-存储器之间性能差距的一种手段Alpha微处理器Timeofafullcachemissininstructionsexecuted:1stAlpha:340ns/5.0ns=68clksx2or1362ndAlpha:266ns/3.

2、3ns=80clksx4or3203rdAlpha:180ns/1.7ns=108clksx6or6481/2Xlatencyx3Xclockratex3XInstr/clock?X存储层次设计的四个问题Q1:信息块可以放在高层的哪里?(Blockplacement)全相联、组相联、直接映射Q2:如果信息块在高层,那么如何找到它?(Blockidentification)标记/信息块Q3:在失效时,应该替换掉哪个信息块?(Blockreplacement)随机、LRU、FIFOQ4:在写操作时,会发生什么情况(Writestra

3、tegy)回写(WriteBack)或直写(WriteThrough)(使用写缓冲器)Cache性能CPUtime=(CPUexecutionclockcycles+Memorystallclockcycles)clockcycletimeMemorystallclockcycles=(ReadsReadmissrateReadmisspenalty+WritesWritemissrateWritemisspenalty)Memorystallclockcycles= MemoryaccessesMissrateMi

4、sspenaltyCache性能(续)CPUtime=InstructionCount(CPIexecution+MemaccessesperinstructionMissrateMisspenalty)ClockcycletimeMissesperinstruction=MemoryaccessesperinstructionMissrateCPUtime=IC(CPIexecution+MissesperinstructionMisspenalty)ClockcycletimeMemorystallcycles

5、perinstruction=Missesperinstruction(Totalmisslatency–Overlappedmisslatency)AverageMemoryaccesstime=Hittime+MissrateMisspenalty改进Cache性能AverageMemoryaccesstime=Hittime+MissrateMisspenalty1.降低失效率2.降低失效损失,或者3.减少在cache中命中的时间降低失效对失效进行分类:3CsCompulsory第一次访问一个不在cache中的数据块,

6、该块必须被调入。也称为coldstartmisseso或firstreferencemisses。(即使Cache无穷大,也会失效)Capacity在程序执行中,cache不能存放其所需的所有数据块,就会先放弃一些块然后再找回,这就出现了capacitymisses。(有限大小的全相联Cache也会出现的失效)Conflict如果采用组相联或直接映射的策略,除了义务失效和容量失效,还会因为有太多块要同时映射到同一组中,就会先放弃一些块然后再找回,这就出现了conflictmisses。也称为collisionmisses或inte

7、rferencemisses。(有限大小的N路组相联Cache中出现的失效)3Cs的绝对失效率(SPEC92)Conflict义务失效率非常低2:1Cache规律Conflictmissrate1-wayassociativecachesizeX =missrate2-wayassociativecachesizeX/23Cs的相对失效率ConflictFlaws:forfixedblocksizeGood:insight=>invention如何能减少失效?3Cs:Compulsory,Capacity,Conflict在所有情

8、况,假设总的cache大小不变:在下列情况,会发生什么变化:1)改变块大小:3Cs中哪些失效会受到明显影响?2)改变相联度:3Cs中哪些失效会受到明显影响?3)改变编译器: 3Cs中哪些失效会受到明显影响?1.通过增大块大小来减少失效2.通过增大相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。