基于分布式平台的FDTD并行算法

基于分布式平台的FDTD并行算法

ID:46636178

大小:3.86 MB

页数:10页

时间:2019-11-26

基于分布式平台的FDTD并行算法_第1页
基于分布式平台的FDTD并行算法_第2页
基于分布式平台的FDTD并行算法_第3页
基于分布式平台的FDTD并行算法_第4页
基于分布式平台的FDTD并行算法_第5页
资源描述:

《基于分布式平台的FDTD并行算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2016年9月北京航空航天大学学报Septembe。2016第42卷第9期JournalofBeijingUniversityofAeronauticsandAstronauticsV01.42No.9http:ffbhxb.buaa.edu.cnjbuaa@buaa.edu.cnDOI:10.13700/j.bh.1001-5965.2015.0593基于分布式平台的FDTD并行算法冯圆1’2,代小霞1,唐晓斌1一,龚晓燕3(1.中国电子科学研究院预警机研究所,北京100041;2.空军预警学院雷达技术系,武汉430019;3.火箭军指挥学院指挥系,

2、武汉430013)摘要:基于分布式平台开展一种新的时域有限差分(FDTD)并行算法研究,该算法基于VC++、CUDA5.0平台开发,调用IntelMPI4.1.0库进行测试,在上海交通大学高性能计算中心图形处理单元(GPU)集群、上海超级计算机中心的“魔方”商用超级计算机以及国家超级计算济南中心的“神威蓝光”国产超级计算机等平台开展软件调试。通过对纯CPU、GPU以及CPU和GPU的混合测试,线程调度水平、核心函数处理速度得到明显提升,同时减少了通信执行时间比例,提高了加速比和并行效率,最后以2×2微带阵列为验证模型进行拓扑优化测试,结果证明该算法准确

3、、有效。关键词:Mur;消息传递接口;图形处理单元(GPU);时域有限差分(FDTD);分布式平台中图分类号:TP393.027文献标识码:A文章编号:1001.5965(2016)09-1874.10时域有限差分(FDTD)方法自1966年Yee¨1提出后,经过几十年的发展,已成为一种成熟的数值方法被广泛应用于辐射天线分析、散射和雷达截面计算和周期结构分析等多个方面。但是,随着大规模精细电磁计算需求的不断发展,经典的理论和方法遇到前所未有的挑战,特别是在确定复杂电大尺寸目标的电磁辐射和散射特性、建立精确通用的电磁理论模型和数值模型、复杂平台环境下的散

4、射和传播机理等方面存在困难。为此,国内外研究者着眼于FDTD3个关键性技术,即高效计算网格建立技术、FDTD大规模并行计算中的效率提升和拓扑结构技术、求解区域协同计算适应性改进技术开展大量的开创性工作。在FDTD大规模并行计算中的效率提升和拓扑结构技术、求解区域协同计算适应性改进技术方面,2004年Su等口。提出了MPI与OpenMP结合的方式在SGIOrigin2000并行系统上实现了FDTD并行计算;2005年余文华等∞1研究了FDTD并行算法实现、边界数据交换方式、并行效率等问题,使用200个以上处理器达到90%以上的并行效率;2004年Krak

5、iwskyHl、2007年Ad—ams‘51等分别开展了单核图形处理单元(GPU)与Intel、AMD处理器的比对测试;2009年Du等旧。开展了基于CUDA平台的三维FDTD程序测试,该程序用C程序编写,在CPU系统下测试,实现了10倍的加速比;2008年刘瑜等¨1结合了suBj和余文华¨1等的工作,在Pentium4CPU组成的PC集群系统上实现了超线程下的并行方案;2010年Komatitsch等¨1在GPU集群上(192颗)模拟地震波传播,比CPU版性能提升几十倍;2010年Jacobsen等一1在Lincoln系统上取得8线程CPU版本130

6、4的性能;2012年Nagaoka和Watan—abe¨圳运用3个节点(一共2l块NVIDIATESLAC2070GPU)提高30%的并行效率;2011年Yang收稿13期:2015-09.10;录用13期:2015—12-04;网络出版时间:2016-02-1516:30网络出版地址:WWW.cnki.nelVkcms/detail/11.2625.V,20160215.1630,002.html基金项目:国家“863”计划(2012AA01A308);国家“973”计划(613206)$通讯作者:Tel.:010-68893613E·mail:sc

7、ience—xiaoxiao@163.corn引用格式:冯圆,代小厦,唐晓斌,等.基于分布式平台的FDTD并行算法fJJ.北京航空航天大学学报,2016,42f9):1874—1883.FENGY.DAIXX,TANGXB.eta1.FDTDparallelalgorithmbasedOHdistributedplatformI

8、j.JournalofBeijingUniversityofAeronauticsandAstronautics,2016,42(9):1874—1883(inChinese).第9期冯圆,等:基于分布式平台的FDTD并行算法

9、1875等¨叫在由TeslaC1060和TeslaS1070组成的服务器上成功加速了冒泡排序、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。