典型文献
面向OpenVX核心图像处理函数的并行架构设计
文献摘要:
传统的可编程处理器虽然高度灵活,但其处理速度及性能不及专用集成电路(ASIC),而图像处理往往是多样、密集且重复的操作,因此处理器要兼顾速度、性能及灵活性.OpenVX是图像图形处理、图计算和深度学习等应用的预处理或者辅助处理开源标准,基于最新的OpenVX 1.3标准中的核心图像处理函数库,设计并实现了一种可编程、可扩展的专用指令集处理器(ASIP)——OpenVX并行处理器.首先分析对比了各种互联网络的拓扑特性,选择了性能比较突出的层次交叉互联网络(HCCM+)作为系统主干,在网络节点处设置处理单元(PE)构成支持动态配置的4×4 PE阵列,结合高效的路由通信方式设计了并行处理器,实现可编程的图像处理.其次所提出的架构适合数据并行计算和新兴的图计算,两种计算模式可单独或混合配置使用,分别将核心视觉函数及图计算模型映射到并行处理器上对两种模式进行验证,对比PE数目不同的情况下图像处理的速度.实验结果表明,并行处理器能够完成对基本核心函数和高复杂度的图计算模型的映射,在数据并行计算和流水线处理两种模式下,可以对图像处理线性加速,调用16个PE对各类函数的平均加速比可达15.0375.验证环境采用20 nm XCVU440平台芯片,综合实现后频率为125 MHz.
文献关键词:
OpenVX核心图像处理函数;专用指令集处理器(ASIP);并行处理器;层次交叉互联网络(HCCM+);图计算模型
中图分类号:
作者姓名:
潘风蕊;李涛;邢立冬;张好聪;吴冠中
作者机构:
西安邮电大学 电子工程学院,西安 710121;西安邮电大学 计算机学院,西安 710121
文献出处:
引用格式:
[1]潘风蕊;李涛;邢立冬;张好聪;吴冠中-.面向OpenVX核心图像处理函数的并行架构设计)[J].计算机科学与探索,2022(07):1570-1582
A类:
OpenVX,并行处理器,HCCM+,图计算模型,XCVU440
B类:
处理函数,并行架构,架构设计,可编程,处理速度,专用集成电路,ASIC,此处,图形处理,开源,函数库,可扩展,专用指令,指令集,ASIP,分析对比,互联网络,拓扑特性,性能比较,比较突出,交叉互联,网络节点,处理单元,PE,动态配置,路由,通信方式,数据并行,并行计算,计算模式,模型映射,射到,两种模式,下图,流水线,调用,加速比,验证环境,MHz
AB值:
0.262659
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。