异构多核下cache替换算法的性能优化研究

异构多核下cache替换算法的性能优化研究

ID:23934188

大小:1.42 MB

页数:68页

时间:2018-11-11

异构多核下cache替换算法的性能优化研究_第1页
异构多核下cache替换算法的性能优化研究_第2页
异构多核下cache替换算法的性能优化研究_第3页
异构多核下cache替换算法的性能优化研究_第4页
异构多核下cache替换算法的性能优化研究_第5页
资源描述:

《异构多核下cache替换算法的性能优化研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中文图书分类号:TP391密级:公开UDC:004学校代码:10005硕士学位论文MASTERALDISSERTATION论文题目:异构多核下Cache替换算法的性能优化研究论文作者:范清文学科:计算机科学与技术指导教师:方娟教授论文提交日期:2017年5月UDC:004学校代码:10005中文图书分类号:TP391学号:S201407067密级:公开北京工业大学工学硕士学位论文题目:异构多核下Cache替换算法的性能优化研究英文题目:RESEARCHONPERFORMANCEOPTIMIZATIONO

2、FCACHEREPLACEMENTALGORITHMFORHEROGENEOUSMULTI-CORESYSTEMS论文作者:范清文学科专业:计算机科学与技术研究方向:计算机系统结构申请学位:工学硕士指导教师:方娟教授所在单位:计算机学院答辩日期:2017年5月授予学位单位:北京工业大学独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学位或

3、证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:范清文日期:2017年5月22日关于论文使用授权的说明本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵守此规定)签名:范清文日期:2017年5月22日导师签名:方娟日期:2017年5月22日摘要摘要大数据时代的到来给海量数据处理带来了新的挑

4、战,传统的多核架构难以满足大规模计算的需求,GPU和CPU在芯片上的结合是缓解大规模计算压力的一种趋势。对传统多核处理器而言,由于芯片上的核心数量越来越多,长期积累下来的处理器发展速度与存储器系统发展速度不均衡的现象形成了著名的“内存墙”问题,它对存储系统造成的压力已经很大。如今,除了芯片上核心数量的急剧增长之外还出现了核心类型异质的问题。在CPU-GPU异构多核环境中,CPU应用程序和GPU应用程序具有各自的特性。其中,CPU主要负责执行串行的任务和逻辑控制,GPU因其线程级并行性(Thread-le

5、velParallelism,TLP)在并行计算上具有很大的优势。CPU-GPU异构多核可以充分发挥CPU与GPU在各自应用场景下性能优势,然而这一架构对CPU与GPU之间共享的各类资源尤其是最后一级缓存(Last-levelCache,LLC)的管理造成了极大的压力,严重影响了系统的性能与功耗。本文针对异构多核系统下共享内存的优化方案进行分析发现,目前异构多核环境下Cache替换算法的实现都是线程盲目的,未能较好地利用GPU应用程序和CPU应用程序各自的特性,因此缓存的利用率较低。许多GPU应用程序通

6、过线程级并行性和缓存来降低内存延迟的消极影响,而大多数内存密集型CPU基准测试程序则只能通过缓存来弥补内存延迟。因此,CPU应用程序对Cache的需求较GPU应用程序而言更为敏感。针对以上特点,本文提出了面向缺失感知的异构多核缓存替换算法以提升异构多核系统下的系统性能。优化后的缓存替换算法对CPU与GPU的缓存请求的优先级别区别对待,CPU应用程序和GPU应用程序动态地非绝对公平地共享最后一级缓存,从而保证缓存敏感度较高的CPU应用程序在缓存中具有较长的生命周期。此外,本文采用的缓存替换算法综合考虑了C

7、ache块的新近访问时间和访问频率,通过在最后一级缓存上缓存缺失次数的比较来动态地选择LRU或LFU算法以适合当前的运行状态。该算法不仅考虑了异构多核下CPU应用程序与GPU应用程序的运行特征,还结合了LRU与LFU两大经典替换算法,对异构多核下最后一级缓存的高效利用具有重要的意义。为充分发挥两大经典算法各自的优势,本文提出了基于数据块重用度的动态调整替换算法。这一算法对CPU与GPU应用程序的缓存优先级进行区别对待,同时增加与缓存队列长度一样的指针数组来放置被换出的缓存块地址信息,用于避免LRU替换算

8、法容易出现Cache抖动现象的问题。该算法既考虑了不同类型核心的访存特征,又考虑了程序运行过程中的程序局部-I-北京工业大学工学硕士学位论文性,从而达到在异构多核下提升系统性能的目的。为了精准地评估实验方案对系统性能的影响,本文采用gem5-gpu模拟器作为基础架构模拟平台,通过组合运行SPECCPU2006+GPURodinia的基准测试应用程序来评估本文的设计方案对系统性能的影响。实验结果表明,本文设计实现的算法与传统的LRU替换算法相

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。