高通量计算系统的构建原理、支撑技术及云服务应用

高通量计算系统的构建原理、支撑技术及云服务应用

ID:34417551

大小:425.56 KB

页数:29页

时间:2019-03-05

高通量计算系统的构建原理、支撑技术及云服务应用_第1页
高通量计算系统的构建原理、支撑技术及云服务应用_第2页
高通量计算系统的构建原理、支撑技术及云服务应用_第3页
高通量计算系统的构建原理、支撑技术及云服务应用_第4页
高通量计算系统的构建原理、支撑技术及云服务应用_第5页
资源描述:

《高通量计算系统的构建原理、支撑技术及云服务应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、项目名称:高通量计算系统的构建原理、支撑技术及云服务应用首席科学家:李国杰中国科学院计算技术研究所起止年限:2011.1至2015.8依托部门:中国科学院二、预期目标总体目标:本项目探索面向高通量计算的系统结构新模型新机制,重点研究适应高通量并行处理计算模式的微处理器芯片和节点原型的新结构设计方法,设计可扩展、高效能、高可靠的芯片结构与系统结构,并研究面向高通量应用模式的软件支撑技术、软件设计方法与开发环境。本项目的总体目标是通过探索高通量计算的新模型、新结构和新的设计方法,为5-10年以后我国研制达到当时国际先进水平的可扩展、高效能、高可靠的高通量计算系统

2、奠定技术基础并培养高水平人才,从而为国产高通量计算系统的研制和应用的可持续发展提供强大的后劲。同时,这些成果对未来信息技术的发展,也将产生巨大的推动作用。项目五年预期目标:本项目将在高通量计算系统构建原理、支撑技术及云服务应用的研究方面,提出一批创新方法和关键技术,在ACM/IEEE重要学术刊物和重要学术会议(如ISCA、OSDI、HPCA、PLDI、ISSCC、DSN等)上发表学术论文百篇以上,并申请国内外发明专利百件以上。研制采用基于2015年主流工艺技术的千线程芯片原型,研制满足高通量计算需求的万线程节点原型,研制移动云服务平台原型。体现出如下几个方面

3、的创新和贡献:ò面向高通量计算的可扩展、高效能并行微结构:提出大规模线程并行的体系结构,构造千线程芯片的原型,展示其可扩展、高通量的特性。在千线程芯片原型的后硅(postsilicon)调试、失效预测和检测、面向高通量应用的测试等方面提出创新方法,为确保能耗约束下的千线程芯片原型的可靠处理能力提供关键技术支持。ò面向EB级数据并发处理的新型系统结构:支持海量并发请求和数据并发流动的高效能、可扩展的并行系统结构,提出面向高通量计算系统应用的计算机系统执行模型,开发支持高并发、海量数据流动、低功耗、应用感知的数据通道和存储系统。相关技术集成在一个万线程节点原型中

4、。与现有同规模系统相比,效能比可提高1-2个数量级。ò高通量计算系统的可靠性设计方法和支撑环境:提出低开销的高通量处理芯片的在线故障检测和容错方法,提出软硬件协调的高通量计算系统的失效检测和恢复方法,为高通量计算系统建立从芯片级到系统级的故障自预测、自检测、自定位、自隔离和自愈合的可靠性保障框架,并在高通量计算系统原型中集成,为数据中心应用提供透明的5S可靠性保证支持。ò面向亿级并发负载的编程模型与支撑环境:提出易编程的计算并行模式和数据并行模式的编程抽象及其表示方法;提出通过编程语言和运行时系统协同映射高层编程抽象到底层执行模型,充分挖掘和利用体系结构并行

5、性以及局部性的方法;力求为学术界和产业界提供开源的高通量计算系统编程环境;并集成到高通量计算系统原型中,通过关键应用(如移动服务)展示高通量计算系统编程模型可编程性和性能。ò高通量计算系统的云计算服务环境:实现能力服务流动机制、资源虚拟化及其提供机制和面向领域的能力服务提供机制与原理,在移动服务领域示范应用,实现移动服务从“瘦客户端——〉富网络”到“瘦客户端——〉富云能力”的重大转变,并研制针对移动服务的云计算平台。ò高效可扩展移动服务关键技术及应用:提出支持大规模并发的移动服务请求分发机制;提出服务资源共享与隔离机制;提出服务资源需求预测模型及智能高效的服

6、务资源调度策略;提出移动网络服务的按需聚合、智能协同机制;建立移动网络环境下服务运行的自适应机制;提出移动服务交付机制,提供支持大规模并发的移动云服务应用示范。通过本项目的研究,也将在高通量计算系统的构建原理、支撑技术及云服务应用等方面,培养一批创新型人才。三、研究方案本项目的研究,围绕新型应用(如物联网、三网融合、云计算等)对计算机系统所带来的技术挑战和应用发展的重大需求,重点从处理芯片和系统的设计方法、配套软件、服务提供、应用模式和可靠性等方面开展工作,提出并实现有助于解决重大科学问题的高通量计算系统的创新结构和设计方案。主体研究思路是构造数据中心所需的

7、原型硬件系统,在系统设计中将以构建海量数据的高效流动通路为核心问题开展,其核心是面向海量请求处理的芯片设计,并在此基础上构建高通量硬件研究平台。基于硬件平台的执行模型,构建适应亿级并发线程的编程语言和编程环境,进而研究云计算服务平台,包括硬件系统资源能力部署、监控、调度和可用能力的提供等,从而为上层按需聚合、智能协同的移动服务负载提供可用的服务接口。并在芯片到系统的各层面进行5S可靠性设计。这样,总体构建出面向EB级数据、亿级并发请求的新型高效能高通量计算系统结构,探索出具有普适意义的高通量计算研究方法。总体研究方案如下图所示。图1.总体研究方案从技术途径上

8、,本项目除加强理论分析和创新外,在处理器芯片的设计中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。