intel xeon phi协处理器高性能编程指南 目录

intel xeon phi协处理器高性能编程指南 目录

ID:15692168

大小:670.00 KB

页数:10页

时间:2018-08-04

intel xeon phi协处理器高性能编程指南 目录_第1页
intel xeon phi协处理器高性能编程指南 目录_第2页
intel xeon phi协处理器高性能编程指南 目录_第3页
intel xeon phi协处理器高性能编程指南 目录_第4页
intel xeon phi协处理器高性能编程指南 目录_第5页
资源描述:

《intel xeon phi协处理器高性能编程指南 目录》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、目录9目录第1章绪论11.1更加并行的趋势11.2为什么需要IntelXeonPhi协处理器21.3协处理器平台51.4第一款IntelXeonPhi协处理器71.5控制“Ninja鸿沟”于一定范围91.6移植与优化的双重优势91.7何时使用IntelXeonPhi协处理器101.8实现处理器性能最优111.9为何扩展超过100个线程如此重要111.10最大化并行程序性能141.11评估高度并行执行的能力141.12对于GPU是怎么样的151.13易于移植,也易于提升性能161.14性能移植161.15超线程与多线程171.16协处理器主要使用模型:MPI和Offload1

2、71.17编译器和编程模型181.18缓存优化191.19案例和细节20第2章高性能封闭追踪测试驱动232.1揭开引擎盖:协处理器详解242.2发动汽车:与协处理器沟通252.3轻松上路:首次运行代码272.4开始加速:多线程运行代码31目录92.5全速行驶:使用所有核心362.6轻松过弯:访存带宽452.7高速漂移:内存带宽最大化502.8总结52第3章一场乡间公路友谊赛553.1赛前准备——本章重点553.2初识赛道——9点模板算法563.3起跑线上——9点模板基准程序583.4路在前方——运行基准模板代码633.5石子路上——向量化而未规模化653.6全力比赛——向量

3、化加上规模扩展673.7扳手和润滑油!——代码微调703.7.1基准校正703.7.2使用流存储723.7.3使用2MB大型存储页733.8总结74第4章都市畅游:实际代码优化案例774.1选择方向:基本的扩散算法784.2到达路口:计算边界效应784.3寻找林荫大道:代码扩展化844.4雷霆之路:保证向量化864.5剥离:从最内层循环开始894.6尝试更高辛烷含量的燃料:利用数据局部性与分块提升速度924.7高速驾驶认证:高速旅行的总结96第5章大数据(向量)995.1为什么向量化995.2如何向量化1005.3实现向量化的五种方法1005.4六步向量化方法论1025.5

4、通过Cache流:布局、对齐、预取数据104目录95.5.1为什么数据布局影响向量化性能1045.5.2数据校准1065.5.3预取1075.5.4流存储1125.6编译器技巧1145.6.1避免手动展开循环1145.6.2循环向量化的要求(英特尔编译器)1155.6.3内联的重要性,简单性能分析的干扰1165.7编译器选项1175.7.1向量循环内消除内存歧义1175.8编译器指导指令1185.8.1SIMD指令1195.8.2VECTOR与NOVECTOR指令1235.8.3IVDEP指令1245.8.4随机数函数向量化1265.8.5充分向量化1285.8.6-opt

5、-assume-safe-padding选项1305.8.7数据对齐1305.8.8在数组表示法(ArrayNotation)中权衡向量长度1345.9使用数组段(ArraySection)支持向量化1375.9.1Fortran数组段1375.9.2CilkPlus数组段和元素函数1395.10查看编译器生成:汇编代码检测1435.10.1如何找到汇编代码1435.10.2快速查看汇编代码1455.11向量化数值结果差异1495.12总结149第6章多任务(非多线程)1516.1OpenMP、Fortran2008、IntelTBB、IntelCilkTMPlus、Int

6、elMKL1526.1.1需在协处理器上创建任务1536.1.2线程池的重要性1546.2OpenMP1546.2.1并行处理模型155目录96.2.2指导性语句1556.2.3OpenMP上的有效控制1556.2.4嵌套1566.3Fortran20081576.3.1DOCONCURRENT1576.3.2DOCONCURRENT以及数据竞争1576.3.3DOCONCURRENT定义1586.3.4DOCONCURRENT对比FORALL1596.3.5DOCONCURRENT对比OpenMP“Parallel”1606.4IntelTBB1606.4.1发展历史16

7、26.4.2使用TBB1636.4.3parallel_for1636.4.4blocked_range1646.4.5Partitioners1646.4.6Parallel_reduce1656.4.7Parallel_invoke1666.4.8C + +11相关1666.4.9TBB总结1676.5CilkPlus1676.5.1发展历史1696.5.2从TBB借用组件1696.5.3向TBB提供组件1706.5.4关键字拼写1706.5.5cilk_for1706.5.6cilk_spawn与cilk_s

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。