马克思主义方法论在论文中的应用

马克思主义方法论在论文中的应用

ID:28687533

大小:70.50 KB

页数:8页

时间:2018-12-12

马克思主义方法论在论文中的应用_第1页
马克思主义方法论在论文中的应用_第2页
马克思主义方法论在论文中的应用_第3页
马克思主义方法论在论文中的应用_第4页
马克思主义方法论在论文中的应用_第5页
资源描述:

《马克思主义方法论在论文中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、.....页眉马克思主义与社会科学方法论论文设计学生信息姓名学号院系专业邮箱电话论文题目视频解码器在异构多核系统上的实现及并行优化研究背景和意义、文献综述随着视频内容清晰度和视频编码标准复杂度的不断提升,视频实时播放对设备性能需求越来越高。近年来,随着GPU(GraphicProcessUnit,图形处理器)硬件的飞速发展,如何充分利用GPU的强大的计算能力来提高视频解码速度逐渐成为研究热点。为了减少了不同异构平台间的差异,统一异构平台规范,Apple、Intel,NVIDIA,AMD等业界巨头联合制定了开放运算语言OpenCL标

2、准。它提供了一个面向系统通用目的并行编程的开放式、免费标准,为视频解码器的优化提供了机会。在H.264解码过程中,去块滤波(deblockingfilter)部分耗时通常占整体耗时的10%到40%左右。如果能对其进行有效的优化,对整体解码速度将会有明显的提升。然而囿于H.264标准规定的滤波顺序的限制,在保持输出视频视觉质量(Subjectivevideoquality)和峰值信噪比(PSNR,PeakSignaltoNoiseRatio)的条件下,很难对去块滤波部分进行并行优化,因为宏块(Macroblock)间存在很强的数据依

3、赖性。在保证数据依赖的情况下,人们通常在多核上采用基于宏块并行的wavefront方法。本文采用两种并行策略。第一种是传统的2D-wavefront方法,通过对顺序滤波过程的分析,在保证整个滤波过程中宏块间数据依赖的情况下,尽量提升并行度,以提高滤波速度。第二种则是在画质和滤波速度中权衡利弊,以宏块间的依赖关系为代价,对所有宏块进行并发滤波操作,来进一步提高滤波速度。本文充分利用OpenCL平台的SPMD(singleprogrammultidata)以及异构的特点,针对FFmpeg中的H.264解码器,分别采用上述两种策略对滤波

4、过程进行并行化改进。实验结果表明,第一种策略由于为了保持数据依赖导致滤波时核函数发射次数过多,相比CPU单线程慢了20多倍,第二种策略在不考虑内存传输耗时的情况下,滤波速度相比CPU单线程提高了50%左右。.....页脚.....页眉研究目标、主要内容和框架研究H.264解码器在GPU上的优化实现,在开发成本、功耗、系统效率以及普及标准方面都有重大意义。在开发成本方面,GPU的通用计算的开发成本与软件开发类似,远低于硬件开发成本,因此更新更快,在修复bug、改善性能上都能更快的响应。在功耗方面,由于GPU在能耗比方面通常要高于CP

5、U,因此完成相同的工作,GPU的功耗通常也小于CPU,那么基于GPU的解码器系统在功耗上相比CPU也很有优势。在效率方面,由于解码工作转移到GPU执行,那么CPU的负载下降,那么CPU则可以同时做别的工作,整体系统的流畅度也会随之上升。在普及标准方面,H.264解码器的优化可以使更多设备能够支持新修订标准编码视频的解码工作。这样能够使得新修订的普及工作更加顺畅,让更多的终端用户享受到新修订带来的技术优势。尽管如此,由于解码流程中的存在复杂的数据依赖,如果不能很好的处理这些依赖,尽可能提高并行度,在解码速度上并不会有太大的提升,甚至

6、反而会下降。如果能有效的解决数据依赖问题,提高并行度,对将来视频编解码也会有好的一面。摘要IAbstractII目录III1绪言1.1课题背景1.2课题研究的目的和意义1.3国内外概况1.3.1视频编解码1.3.2GPGPU1.3.3相关研究1.4课题的主要研究工作2视频编码与OpenCL2.1H.2642.1.1环路滤波2.2OpenCL2.2.1OpenCL架构2.2.2OpenCL运行时.....页脚.....页眉2.2.3OpenCL存储层次3宏块并行策略3.1基本思路3.2优化方案3.2.1减少分支3.2.2工作组调度3

7、.2.3内存访问3.3实验结果3.4本章小结4不考虑依赖的宏块级并行4.1基本思路4.2内存传输性能分析4.2.1Pinned内存与Paged内存4.2.2映射访问与直接访问4.2.3小结4.3实验结果5不足和展望致谢参考文献本文主要的研究对象是H.264编码中的去块滤波部分。在H.264解码过程中滤波所占比率通常达到了整个过程耗时的20%到40%左右[2][3],在H.264的解码过程中仅次于运动补偿(MotionCompensation)。运动补偿虽然在解码过程中占用时间最多,但是相比去块滤波,其每个宏块的计算量太大,不太适合

8、GPU的小粒度的大规模并行。因此本文选择去块滤波部分作为具体研究对象,尝试基于OpenCL平台对其进行优化。论文框架如下:.....页脚.....页眉主要采用的研究方法(马克思主义方法论)在开始准备本篇论文之前,我主要考虑到了当前客观条件:例如电脑

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。