细粒度并行计算编程模型研究.pdf

细粒度并行计算编程模型研究.pdf

ID:58074507

大小:278.64 KB

页数:4页

时间:2020-04-22

细粒度并行计算编程模型研究.pdf_第1页
细粒度并行计算编程模型研究.pdf_第2页
细粒度并行计算编程模型研究.pdf_第3页
细粒度并行计算编程模型研究.pdf_第4页
资源描述:

《细粒度并行计算编程模型研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、25卷第10期2008年10月微电子学与计算机MICROELECrRONICS&COMPUTERVd.25No.10October2008细粒度并行计算编程模型研究刘伟峰1,王智广2(1中国石油化工股份有限公司石油勘探开发研究院信息技术研究所,北京100083;2中国石油大学(北京)计算机科学与技术系,北京102249)摘要:作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的多核心微处理器进入主流市场,与之相适应的编程模型发展却相对滞后.对细粒度的并行计算编程模型进行

2、研究.首先,介绍3种典型的多核心微处理器体系结构;其次,介绍3个已有的细粒度并行计算编程模型;最后,探讨并行计算编程模型的必备条件.关键词:细粒度并行计算;图形处理器;图形处理器的通用计算;Cell;统一计算设备架构中图分类号:TP312文献标识码:A文章编号:1000—7180(2008)10—0103—04Fine—grainedParallelComputingProgrammingModelResearchLIUWei—fen91,WANGZhi—gua《(1InformationandTechnologyResea

3、rchInstitute。SINOPECExploration&ProductionResearchInstitute,Beijing100083,China;一2DepartmentofComputerScienceandTechnology,ChinaUniversityofPetroleurn-Beijing,Beijing102249,China)Abstract:Asabridgebetweennaturalrnoddofanapplicationandhardwaremoddofcomputer,programm

4、ingmoddisimportantincomputerindustry.Nevertheless,evolutionofprogrammingmodelcouldnotsuitalreadyboostedmulti—coremicroprocessorswhichhavefine-grainedparallelcomputingability.Thspaperfocusonfine-grainedparalldcomputingprogrammingmodel.Aboveall,weintroduce3typicalmul

5、ti—coremicroprocessorarchitectures;secondly,weintroduce3alreadyexistfine-grainedparallelcomputingprogrammingmodels;finally,weresearchthefutureoffine-grainedparallelcomputingprogrammingmodd.Keywords:fine-grainedparallelcomputing;GPU;GPGPU;cell:CUDA1引言2细粒度并行计算硬件体系结构随

6、着一系列单芯片多处理器进入主流市场,并行程序设计所依赖的硬件土壤已经成熟.但就编程模型来讲,以往MPI模型的粗粒度结构和OpenMP的编译器优化已经不能满足单芯片上核与核之间的细粒度通信.所以,目前迫切需要研究可以适应多种单芯片多处理器体系结构的统一细粒度并行计算编程模型.文中在介绍已有的典型多核心微处理器体系结构和并行编程模型的基础上,对细粒度并行计算编程模型的必备条件进行研究.收稿日期:2008—06—13目前典型的单芯片多处理器包括:(1)多核(Multi—core)CPU;(2)许多核(Many—core)图形处理器

7、(GraphicsProcessingUnit,GPU);(3)异构(het—erogeneous)多核Cell微处理器.这三种单芯片多核微处理器的共同特点是都在单个芯片上集成多个核心以提高计算能力.相对于传统的单核心微处理器,在一个芯片上放置多个低频率低复杂度的核更能够提高计算能力,也能利用摩尔定律带来的每24个月翻番的大量晶体管.图IE1j很好地显示了这种性能上的改观,3.0GHz的104微电子学与计算机2008焦Intel双核CPU的浮点运算能力是同频率单核CPU的5倍.而包含8个计算核心的异构Cell芯片的浮点运算能

8、力是Intel四核CPU的2倍多.包含128个轻量级核心的TeslaGPU的浮点运算能力更达到后者的5倍以上.20032004200520062007时间图1CPU,GPU和CeU的单精度FLOPS理论峰值2.1多核CPU体系结构模型2005年,Intel和AMD正式向主流消费级市场推出了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。