首站-论文投稿智能助手
典型文献
并行规约与扫描原语在ReRAM架构上的性能优化
文献摘要:
规约与扫描是并行计算中的核心原语,其并行加速至关重要.然而,冯· 诺依曼体系结构下无法避免的数据移动使其面临"存储墙"等性能与功耗瓶颈.近来,基于ReRAM等非易失存储器的存算一体架构支持的原位计算可一步实现矩阵-向量乘,已在机器学习与图计算等应用中展现了巨大的潜力.提出面向忆阻器存算一体架构的规约与扫描的并行加速方法,重点阐述基于矩阵-向量乘运算的计算流程和在忆阻器架构上的映射方法,实现软硬件协同设计,降低功耗并提高性能.相比于GPU,所提规约与扫描原语可实现高达两个数量级的加速,平均加速比也可达到两个数量级.分段规约与扫描最大可达到五个(平均四个)数量级的加速,并将功耗降低79%.
文献关键词:
规约;扫描;ReRAM;存算一体架构;并行计算
作者姓名:
金洲;段懿洳;伊恩鑫;戢昊男;刘伟峰
作者机构:
中国石油大学(北京)信息科学与工程学院,北京 102249
引用格式:
[1]金洲;段懿洳;伊恩鑫;戢昊男;刘伟峰-.并行规约与扫描原语在ReRAM架构上的性能优化)[J].国防科技大学学报,2022(05):80-91
A类:
B类:
规约,原语,ReRAM,性能优化,并行计算,并行加速,体系结构,存储墙,近来,非易失存储器,存算一体架构,实现矩阵,图计算,出面,忆阻器,加速方法,计算流程,映射方法,软硬件协同设计,降低功耗,GPU,数量级,加速比,功耗降低
AB值:
0.345661
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。