基于gpgpu的数字图像并行化预处理

基于gpgpu的数字图像并行化预处理

ID:32370446

大小:419.12 KB

页数:3页

时间:2019-02-03

基于gpgpu的数字图像并行化预处理_第1页
基于gpgpu的数字图像并行化预处理_第2页
基于gpgpu的数字图像并行化预处理_第3页
资源描述:

《基于gpgpu的数字图像并行化预处理》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、计算机测量与控制.2009.17(6)设计与应用ComputerMeasurement&Control·1169·文章编号:167124598(2009)0621169203中图分类号:TP391文献标识码:A基于GPGPU的数字图像并行化预处理宋晓丽,王庆(西北工业大学计算机学院,陕西西安710072)摘要:首先简要介绍了统一设备架构CUDA(ComputeUnifiedDeviceArchitecture)技术的背景、特点、内存模型,利用通用计算图形处理单元GPGPU(GeneralPurposeGPU)及CUD

2、A技术,实现了图像直方图均衡化和薄云去除的并行化处理,与传统的基于CPU的方法相比,两个基于GPGPU的图像预处理操作的执行效率分别提高了40倍与80倍左右,在大规模实时性图像处理操作中,有很大的实用价值。关键词:GPGPU;CUDA;直方图均衡;薄云去除;并行计算DigitalImageParallelPre-ProcessingBasedonGPGPUSongXiaoli,WangQing(SchoolofComputerScience,NorthwesternPolytechnicalUniversity,Xi

3、’an710072,China)Abstract:ParallelprocessingofhistogramequalizationandremovaloflightcloudforgrayscaleimagesareimplementedbyGPGPUandCUDAtechnique.Theefficienciesoftwoimagepre-processingoperationssimulatedonGPGPUcanbeimprovedupto40and80timescomparedtothesequential

4、methodsbasedonCPU,respectively.Thisapproachcanberedoundedtoreal-timeapplicationsforlargescaleimageprocessingandanalysis.Keywords:GPGPU;CUDA;histogramequalization;removaloflightcloud;parallelcomputing0前言算,+6理算法具有内在的并行性,控制较为简单,因此可以利用GPGPU来突破CPU在浮点运算能力上的瓶颈,对于大在过去的

5、几十年里,人们一直在寻找各种加速图像处理的规模的需要实时性的图像预处理工作,这种在图像处理操作执方法,然而受到CPU本身在浮点计算能力上的限制,对于那行效率上的大幅度提高是非常必要的。本文利用CUDA技术,些需要高密度计算的图像处理操作,过去传统的在CPU上实在GPGPU上实现了图像直方图均衡化和薄云去除的并行化处现的方法,并没有在处理性能与效率上有很大的进步。然而,理,实验结果表明,该方法在图像预处理的执行效率上,比在近些年来随着可编程图形处理器单元(GPU)在性能上的飞CPU上有了很大的提高。速发展,利用GPU加

6、速图像处理的技术成为研究热点。GPGPU全称GeneralPurposeGPU[1],即通用计算图形1CUDA概述处理单元,也就是将GPU用于3D图形处理已外的通用计算,CUDA计算加速的实质是将一个大问题拆分为多个小问[2][3]现在其应用领域已扩展到了几何造型、数值计算、流体模题,这多个小问题之间是相互独立的,再把这些小问题交给[4][5][6][7][8]拟、三维重建、场景绘制、数据库操作等领域。传统GPU做大量并行化处理,从而提高整体计算性能。在使用的GPGPU方法,是通过GL/OpenGL等这一类现有的图形

7、函CUDA组织程序时,GPU被看作一个可以并行执行大量线程数库,来编写shadinglanguage,将通用计算转化为图形计算,的计算设备Device,它作为主控CPU或Host的协处理器执行其程序编写较为繁琐,对程序员的专业知识要求较高。Com2运算。支持CUDA的硬件设备由一组相同结构的流多处理器puteUnifiedDeviceArchitecture(统一计算设备架构,简称CUDA)是NIVIDIA公司推出地一种GPGPU技术,它提供了类似C语言的GPGPU程序开发环境,编程较为简单,它能让多个GPU芯片同步

8、协调的进行计算,使数据并行执行,速度可提升为传统CPU执行方式的几十甚至上百倍。许多图像预处理操作都是对图像像素的重复性高密度运收稿日期:2008211208;修回日期:2008212210。基金项目:“十一五”国防预研项目(70271029);国家863项目(2007AA01Z314)。作者简介:宋晓丽(19832),女,黑龙江省嫩江县人,硕

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。