典型文献
基于塔域的SM4算法快速软件实现
文献摘要:
传统上的SM4软件优化采用查表法,其性能受到cache大小制约,而且易遭到缓存-计时攻击.本文给出了面向SIMD实现的SM4的S盒优化实现,基于塔域优化技术,将SM4的8比特S盒布尔表达式结果的比特切片门复杂度从497降低到115.使用SIMD技术的AVX512指令集和比特切片技术实现512组SM4分组消息的并行加解密.基于OpenSSL开源库完成了快速SM4不同工作模式和多线程下加密的性能测速.在Intel Core i7-11800H@2.3 GHz处理器上使用本方案对SM4算法进行的软件优化实现,其ECB模式在单线程下的加密峰值速度达到了6671 Mbps.同已公开文献中的最优实现性能2580 Mbps(Intel Core i7-7700HQ@2.8 GHz)/3306 Mbps(Intel Core i7-11800H@2.3 GHz)相比,性能提升了159%/101%.
文献关键词:
SM4算法;比特切片;SIMD;塔域实现
中图分类号:
作者姓名:
王磊;龚征;刘哲;陈锦海;郝金福
作者机构:
华南师范大学 计算机学院, 广州 510631;南京航空航天大学 计算机科学与技术学院, 南京 211106;密码科学技术国家重点实验室, 北京 100878
文献出处:
引用格式:
[1]王磊;龚征;刘哲;陈锦海;郝金福-.基于塔域的SM4算法快速软件实现)[J].密码学报,2022(06):1081-1098
A类:
布尔表达式,比特切片,片门,AVX512,11800H,7700HQ,塔域实现
B类:
SM4,软件实现,软件优化,查表法,cache,缓存,计时攻击,SIMD,优化实现,优化技术,指令集,切片技术,加解密,OpenSSL,开源,源库,多线程,测速,Intel,Core,i7,GHz,处理器,ECB,单线程,峰值速度,Mbps,性能提升
AB值:
0.316704
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。