计算机仿真原理及应用课件

计算机仿真原理及应用课件

ID:22031390

大小:6.41 MB

页数:74页

时间:2018-10-26

计算机仿真原理及应用课件_第1页
计算机仿真原理及应用课件_第2页
计算机仿真原理及应用课件_第3页
计算机仿真原理及应用课件_第4页
计算机仿真原理及应用课件_第5页
资源描述:

《计算机仿真原理及应用课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、计算机仿真原理与应用单位:物理电子学院主讲人:王刚Email:buncan_wang@126.com贯穿整个计算机技术发展的核心目标:提高计算性能!Intel微处理器每秒1千8百亿次浮点运算!近20年性能提高3千多倍巨型机:中国天河一号,2010年底世界TOP500强第1名每秒2千5百多万亿次浮点运算,近20年性能提高3千多倍亿亿千万亿百万亿十万亿万亿千亿百亿十亿亿2011年6月日本“KComputer”以每秒1亿亿次名列第一,几乎是第2-9位的总和,中国天河位列第二亿亿千万亿百万亿十万亿万亿千亿百亿十亿亿提高计算机性能的

2、主要手段1.提高处理器字长:70-80年代:Intel处理器:71年,4004,4bits;78年,8086,8bits;82年,80286:16bits;85年~90s,80386,486,Pentium,P2,P3,P4:32bits05年~,PentiumD往后-Corei3,i5,i7:64bits提高计算机性能的主要手段2.提高集成度摩尔定律:芯片集成度每18个月翻一倍,计算性能提高一倍提高计算机性能的主要手段3.流水线等微体系结构技术实现指令级并行(Instruction-LevelParallelism,IL

3、P)RISC结构5级流水线提高计算机性能的主要手段3.流水线等微体系结构技术分支预测,寄存器重命名,超长指令字(VLIW),超标量(Superscalar),乱序执行,Cache……Pentium4(CISC结构)采用了20级复杂流水线提高计算机性能的主要手段4.提高处理器频率:1990s-2004:所有这些技集成度术极大地提高了微处理器的计算性能,但2004年后处理器的性能不再像人们预期的那样提高单核处理器性能提性能升接近极限!单核处理器性能提升接近极限1.VLSI集成度不可能无限制提高芯片集成度已进入极小尺度级别,集成

4、度不可能无限制提高1nm(纳米)约头发直径的6万分之一或4个原子长度10-20nm仅有几百个原子的长度单核处理器性能提升接近极限2.处理器的指令级并行度提升接近极限长指令字,流水线,分支预测,寄存器命名,超标量,乱序执行,动态发射,高速缓冲(Cache)……高级流水线等各种复杂的微体系结构技术都已得到研究应用,难以进一步挖掘更多的指令级并行性(Instruction-LevelParallism)单核处理器性能提升接近极限3.处理器速度和存储器速度差异越来越大处理器性能每2年翻一倍,而存储器性能每6年翻一倍为了匹配两者间速

5、度差异,处理器需要做越来越大的CacheCPU计算速度:~1ns级别主存访问速度:100ns级别单核处理器性能提升接近极限4.功耗和散热大幅增加超过芯片承受能力晶体管密度不断提高,单位面积功耗和散热大幅增加主频提高导致功耗和散热急剧增加功耗P=CV2f,C:时钟跳变时门电路电容,V:电压,f:主频晶体管数越多,电容越大=>功耗越大;主频越高=>功耗越大CitefromEdwardL.Bosworth,ThePowerWall,2010单核处理器性能提升接近极限n2005年前,人们预期可以一直提升处理器主频n但2004年5月

6、Intel处理器TejasandJayhawk(4GHz)因无法解决散热问题最终放弃,标志着升频技术时代的终结2007年人们大大降低了主频2005年前提升预期人们预计2005年后的主频提Intel转入升路线图多核技术CitefromEdwardL.Bosworth,ThePowerWall,2010单处理器向多核并行计算发展成为必然趋势n多核/众核并行计算2005年Intel全面转入多核计算技术,采用多核/众核构架,简化单处理器的复杂设计,代之以单个芯片上设计多个简化的处理器核,以多核/众核并行计算提升计算性能双核:Pen

7、tiumD(05),EE(06),Xeon(06)Core2DuoE系列,T系列(06)Corei3,i5(10)4核:Core2QuadQ系列(07)典型的双核处理器结构Corei5,i7(08,09,10)6核:Corei7970/980(10)8核:AMDBulldozer(10)单处理器向多核并行计算发展成为必然趋势n多核/众核并行计算Intel实验芯片SingleCloudChip,SCC:48核Teraflops,80核ØASCIRed:1996,第一个达到1TFlops(10万亿次浮点运算)的并行计算系统,使

8、用了10,000颗PentiumPro处理器(200MHz),耗电500kW,外加500kW用于机房散热ØTeraflops:达到1.01TFlops(3.16GHz)1.81TFlops(5.7GHz)功耗62W!CitefromIntelwebsite:http://techresearch.int

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。