首站-论文投稿智能助手
典型文献
基于ARM的图像几何变换算法库实现和优化技术研究
文献摘要:
高性能原语基础算法库(Intel?Integrated Performance Primitives,Intel IPP)是面向信号、图像处理领域的高性能多媒体加速库.然而,截至目前,暂时没有基于ARM架构的高性能IPP库.文中针对镜像变换、重映射、仿射、透视变换等基础图像几何变换算法,实现了一个基于ARM计算平台的高性能算法库PerfIPP,并通过SIMD汇编优化、内存对齐、数据预计算、高性能矩阵转置等优化技术,显著提升了上述算法的性能.同时,通过对比不同指令组合、不同指令排列、不同取数存储方式等所带来的性能差异,总结图像几何变换算法在A RM计算平台上实现与优化的关键技术.实验结果表明,在华为鲲鹏920平台上,相比开源计算机视觉库OpenCV,PerfIPP在满足精度要求的同时,在上述基础图像几何变换上获得了108.08% ~435.5%的性能提升,并达到了在英特尔至强E5-2640处理器上Intel IPP库平均性能的83.79%.
文献关键词:
IPP;ARM;NEON Intrinsic;几何变换;插值
作者姓名:
王麓涵;贾海鹏;张云泉;张广婷
作者机构:
中国科学院计算技术研究所计算机体系结构国家重点实验室 北京100190;中国科学院大学计算机科学与技术学院 北京100049
文献出处:
引用格式:
[1]王麓涵;贾海鹏;张云泉;张广婷-.基于ARM的图像几何变换算法库实现和优化技术研究)[J].计算机科学,2022(10):10-17
A类:
Primitives,PerfIPP
B类:
ARM,几何变换,换算,法库,优化技术,原语,语基,Intel,Integrated,Performance,多媒体,暂时,镜像,重映,仿射,透视变换,计算平台,SIMD,汇编优化,对齐,预计算,转置,同指,性能差异,华为,鲲鹏,开源计算机视觉库,OpenCV,精度要求,换上,性能提升,英特尔,E5,处理器,NEON,Intrinsic
AB值:
0.3976
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。