首站-论文投稿智能助手
典型文献
面向FT-M7002平台点积算法的优化实现
文献摘要:
基于国产的FT-M7002平台高性能DSP,针对不同类型的点积算法进行了优化实现,完善了该处理器平台数学库的技术链,充分发挥了FT-M7002内核体系结构优势,对点积算法实现了SIMD向量并行化、DMA双通道传输和SVR传输等优化.该研究充分挖掘了程序的向量并行性,有效地提升了数据传输的速度,提高了程序性能.实验结果表明,输入不同规模大小的数组,不同类型的点积算法在FT-M7002平台上优化后和优化前的平均性能比为12.4166~45.2338.相较于TI官网的dsplib库中不同类型的点积函数在TMS320C6678处理器上运行的性能,FT-M7002平台优化后的性能与TI平台的平均性能比为1.3716~4.5196.实验结果表明了该DSP平台相对于TI主流平台的计算性能优势.
文献关键词:
FT-M7002;DSP;点积算法;向量;DMA双通道传输;SVR传输
作者姓名:
郭盼盼;陈梦雪;梁祖达;马晓畅;许邦建
作者机构:
郑州大学计算机与人工智能学院,河南郑州 450066;国家超级计算郑州中心(郑州大学),河南郑州 450001;湖南大学电气与信息工程学院,湖南长沙 410082;湖南大学信息科学与工程学院,湖南长沙 410082
引用格式:
[1]郭盼盼;陈梦雪;梁祖达;马晓畅;许邦建-.面向FT-M7002平台点积算法的优化实现)[J].计算机工程与科学,2022(11):1909-1917
A类:
M7002,点积算法,dsplib
B类:
FT,优化实现,DSP,该处,处理器,台数,技术链,核体系,体系结构,结构优势,算法实现,SIMD,并行化,DMA,双通道,SVR,并行性,数据传输,程序性,不同规模,数组,性能比,TI,官网,TMS320C6678,平台优化,主流平台,性能优势
AB值:
0.330097
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。