首站-论文投稿智能助手
典型文献
基于CM-Transformer的连续手语识别
文献摘要:
针对捕获手语动作的全局特征和局部特征以及保留图像中原有的结构和捕获上下文联系,提出了一种改进的卷积多层感知机-自注意力(CM-Transformer)方法用于连续手语识别.CM-Transformer将卷积层的结构一致性优势与自注意力模型编码器的全局建模性能相结合,以捕获长期的序列依赖.同时将自注意力模型前馈层替换为多层感知机,以发挥其平移不变性和局部性.使用随机帧丢弃和随机梯度停止技术,减少时间和空间上的训练计算量,防止过拟合,由此构建一种高效计算的轻量级网络;最后使用连接主义时间分类解码器对输入和输出序列对齐,得到最终的识别结果.在两个大型基准数据集上的实验结果表明了所提方法的有效性.
文献关键词:
连续手语识别;卷积神经网络;自注意力模型;多层感知机
作者姓名:
叶康;张淑军;郭淇;李辉;崔雪红
作者机构:
青岛科技大学 信息科学技术学院,青岛266061
引用格式:
[1]叶康;张淑军;郭淇;李辉;崔雪红-.基于CM-Transformer的连续手语识别)[J].北京邮电大学学报,2022(05):49-53,78
A类:
B类:
CM,Transformer,连续手语识别,全局特征,局部特征,上下文,文联,多层感知机,于连,卷积层,结构一致性,自注意力模型,模型编码,编码器,前馈,层替换,平移不变性,局部性,丢弃,随机梯度,减少时间,计算量,过拟合,高效计算,轻量级网络,连接主义,解码器,对齐,基准数据集
AB值:
0.317498
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。