典型文献
面向PMVS算法的自动两级并行翻译方法
文献摘要:
当使用高分辨率的图像作为图像处理算法的输入时会降低算法运行速度,将算法并行化可提升执行效率,但手动将串行程序转换为并行程序则较为繁琐,并且现有自动并行翻译工具性能不稳定,同时翻译后的程序是单一并行模式.面向基于面片的三维多视角立体视觉(PMVS)算法,提出一种从C到CUDA的自动两级并行翻译方法.使用ANTLR自动解析源C代码,通过分析数据依赖关系和循环数组私有化来识别可并行化的循环结构,将算法翻译成CPU多线程和GPU两级并行结构的代码.在算法执行过程中,将输入图像在CPU和GPU上分别进行处理,降低了算法总执行时间.实验结果表明,该方法的计算加速比随着输入图像分辨率的增加逐渐提高,最高约达到32,相比于PPCG和OpenACC自动并行翻译方法提升明显.
文献关键词:
两级并行翻译;图像处理算法;基于面片的三维多视角立体视觉;扩展Backus-Naur范式;抽象语法树
中图分类号:
作者姓名:
刘金硕;黄朔;邓娟
作者机构:
武汉大学 国家网络安全学院 空天信息安全与可信计算教育部重点实验室,武汉 430072;武汉大学 计算机学院,武汉 430072
文献出处:
引用格式:
[1]刘金硕;黄朔;邓娟-.面向PMVS算法的自动两级并行翻译方法)[J].计算机工程,2022(12):16-23
A类:
两级并行翻译,基于面片的三维多视角立体视觉,PPCG,OpenACC,Backus,Naur
B类:
PMVS,翻译方法,图像处理算法,运行速度,并行化,执行效率,串行,程序转换,并行程序,翻译工具,工具性,一并,并行模式,CUDA,ANTLR,自动解析,代码,数据依赖,依赖关系,数组,私有化,循环结构,翻译成,CPU,多线程,GPU,并行结构,算法执行,执行过程,执行时间,加速比,图像分辨率,抽象语法树
AB值:
0.338116
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。