欢迎来到天天文库
浏览记录
ID:28634603
大小:17.75 KB
页数:5页
时间:2018-12-12
《基于图形处理器的球面voronoi图生成算法优化论文》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、学生会的老师就像这个大家庭里的家长,他(她)们慈爱而又严厉,老师们教会我们做人,教会我们学习,教会我们工作。老师对我们的关心与疼爱我们始终看在眼里,记在心里基于图形处理器的球面Voronoi图生成算法优化论文 摘要:基于四元三角格网之间距离计算与比较的球面Voronoi图生成算法相对于扩张算法具有较高的精度,但由于需要计算并比较每个格网到所有种子点的距离,致使算法效率较低。针对这一问题,利用图形处理器并行计算对算法进行实现,然后从GPU共享内存、常量内存、寄存器等三种内存的访问方面进行优化,最后用C++语言和统一计算设备
2、架构开发了实验系统,对优化前后算法的效率进行对比。实验结果表明,不同内存的合理使用能在很大程度上提高算法的效率,且数据规模越大,所获得的加速比越高。 关键词:球面Voronoi图;统一计算设备架构;共享内存;常量内存;寄存器 英文摘要 Abstract:SphericalVoronoidiagramgeneratingalgorithmbasedondistancecomputationandcomparisonofQuaternaryTriangularMesh hasahigherprecisionrelativ
3、etodilationalgorithm.However,massivedistancecomputationandcomparisonleadtolowefficiency.Toimproveefficiency,GraphicProcessingUnit parallelcomputationwasusedtoimplementthealgorithm.Then,thealgorithmwasoptimizedwith时间如白驹过隙,弹指间,我已在学生会工作了一年。这其中有酸有甜有苦也有辣,然而这就是生活,过于平淡倒显
4、得无味,酸甜苦辣俱全方能体现出人生的多彩,方能值得回味,方能使人进步!学生会的老师就像这个大家庭里的家长,他(她)们慈爱而又严厉,老师们教会我们做人,教会我们学习,教会我们工作。老师对我们的关心与疼爱我们始终看在眼里,记在心里respecttotheaccesstoGPUsharedmemory,constantmemoryandregister.Atlast,anexperimentalsystemwasdevelopedbyusingC++andComputeUnifiedDeviceArchitecture toco
5、mparetheefficiencybeforeandaftertheoptimization.TheexperimentalresultsshowthatefficiencycanbeimprovedtoagreatextentbyusingdifferentGPUmemoriesreasonably.Inaddition,ahigherspeedupratiocanbeacquiredwhenthedatascaleislarger. 英文关键词 Keywords:sphericalVoronoidiagram;C
6、omputeUnifiedDeviceArchitecture;sharedmemory;constantmemory;register 近年来,图形处理器技术快速发展,其浮点运算能力和内存带宽已远远超过中央处理器。NVIDIA公司开发的统一计算设备架构为GPU增加了一个易用的编程接口,使得GPU并行计算在群体行为仿真、三维数据并行可视化、地球表面测绘等领域得到广泛应用。 本文利用CUDA对基于距离计算与比较的球面V图生成算法进行实现,然后从GPU共享内存、常量内存、寄存器等三种内存的访问方面,对算法进行优化,最后利用
7、C++和CUDA开发了实验系统,对优化前后算法的效率进行对比。时间如白驹过隙,弹指间,我已在学生会工作了一年。这其中有酸有甜有苦也有辣,然而这就是生活,过于平淡倒显得无味,酸甜苦辣俱全方能体现出人生的多彩,方能值得回味,方能使人进步!学生会的老师就像这个大家庭里的家长,他(她)们慈爱而又严厉,老师们教会我们做人,教会我们学习,教会我们工作。老师对我们的关心与疼爱我们始终看在眼里,记在心里 若将式中的ω定义为一个QTM格网,Ω定义为球面上所有QTM格网的集合,距离函数d定义为球面大弧距离,则式表示的即为基于QTM的球面V图
8、。 基于QTM格网之间距离计算与比较的球面V图生成算法,通过计算并比较每个格网到所有种子点的距离,来确定格网单元所属的Voronoi区域,算法具有计算密集性、指令一致性及相互独立性的特点,本文采用GPU单指令多数据流并行计算模型来执行这些运算,算法实现的核函数伪码如下。 在CUDA架构中有多种内存可
此文档下载收益归作者所有