多核处理器体系结构及并行程序设计

多核处理器体系结构及并行程序设计

ID:36263185

大小:348.05 KB

页数:37页

时间:2019-05-07

多核处理器体系结构及并行程序设计_第1页
多核处理器体系结构及并行程序设计_第2页
多核处理器体系结构及并行程序设计_第3页
多核处理器体系结构及并行程序设计_第4页
多核处理器体系结构及并行程序设计_第5页
资源描述:

《多核处理器体系结构及并行程序设计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、多核处理器体系结构及并行程序设计天津大学于策yuce_air@yahoo.com.cn1Outline多核处理器简介并行程序设计方法学(PCAM)科研及技术(天津大学SRDC及IBM技术中心)2http://graphics.tju.edu.cnhttp://ibm.tju.edu.cnOutline多核处理器简介并行程序设计方法学(PCAM)科研及技术(天津大学SRDC及IBM技术中心)3http://graphics.tju.edu.cnhttp://ibm.tju.edu.cn什么是多核处理器?两个或多个独立运行的内核集成于同一

2、个处理器上面双核处理器=一个处理器上包含2个内核多核处理器=一个处理器上包含2个或多个内核Core0Core1FrontSideBus4http://graphics.tju.edu.cnhttp://ibm.tju.edu.cn为什么要采用多核技术?5http://graphics.tju.edu.cnhttp://ibm.tju.edu.cn最终目标:提升用户的体验摩尔定律——不断发展和改进处理器的性能最大限度地利用越来越多的晶体管实现最优的价值缩减处理时间,提高计算能力开发平台的新特性和新功能6http://graphics.t

3、ju.edu.cnhttp://ibm.tju.edu.cn通过并行方式改进处理器的性能2005+Dual-andMulti-core2-waySMPsystem4Cores>4Threads2001Hyper-Threading2-waySMPsystem2Cores4Threads1995Multi-processing2-waySMPsystem2Cores2Threads7http://graphics.tju.edu.cnhttp://ibm.tju.edu.cn多核技术的发展CacheExecutionStateState

4、BusCacheExecutionStateBusCacheExecutionStateBusCacheExecutionStateBusCacheExecutionStateBusPentium4withHTDualXeonProcessorsDualCore2Threads1Package2Threads2Packages2Threads1PackageTwoindependentexecutioncoresinthesameprocessor8http://graphics.tju.edu.cnhttp://ibm.tju.ed

5、u.cn几种不同的技术HT–HyperThreading:2threadsrunningonthesameprocessorcore处理器上的某些资源会被共享使用相同的缓存和运算器DC–DualCore:2executioncoresinthesameprocessorpackage共享系统总线与双处理器的性能相同DP/MP–Dual/Multi-Processing:2ormoreprocessorsinthesamesystem只共享系统总线,独立缓存高性能,资源冲突少9http://graphics.tju.edu.cnhttp

6、://ibm.tju.edu.cn双核技术VS.超线程技术双核是真正意义上的双处理器不会发生资源冲突每个线程拥有自己的缓存、寄存器和运算器一个3.2GHzSmithfiled在性能上并非等同于3.2GHzP4withHT的2倍HT使处理器的性能至少提升了1/3双核的性能相当于2块non-HT处理器双核技术与HT技术在性能上的对比Ex1:两个floatingpoint线程(Smithfieldclient)每个线程拥有自己的FPU,没有资源冲突尽管性能上没有提升太多,但仍然优于HTEx2:一个integer线程与一个floatingpo

7、int线程性能大幅度提升没有资源冲突10http://graphics.tju.edu.cnhttp://ibm.tju.edu.cnSinglecore,WithHT(Eg.Pentium4ProcessorWithHT)IntegerandFloatingPointThreadsL2CacheandControlL2CacheandControlL1D-CacheandD-TLBSchedulersIntegerTraceCacheRename/AllocuopQueuesBTBuCodeROM33DecoderBTB&I-TLB

8、FloatingPoint2threadscanbeexecutedatthesametime(perprocessor)ifthey’renotcompetingforthesameexecutionresource1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。