首站-论文投稿智能助手
典型文献
基于注意力机制的视频眼震图分类算法研究
文献摘要:
现有的良性阵发性位置性眩晕视频眼震图分类算法存在以下不足:人工提取的特征主观性和局限性强;眼球的轴向转动特征提取困难;仅能区分正常人群和患者,或对简单的眼震进行分类.针对上述问题,提出了一种基于注意力机制的视频眼震图分类算法.以轻量级模型三维MobileNetV2为基础网络进行特征提取,在全局细节特征、时空信息丰富的网络低层引入全局时空注意力模块,融合眼球震颤空间信息和帧间时序信息;在网络高层引入时空通道注意力机制,筛选高级语义特征;采用带有类别调制系数的交叉熵损失函数对网络进行训练,有效缓解了类别数量不平衡的问题.在复旦大学附属眼耳鼻喉科医院提供的包括66种类别的视频眼震图数据集上进行了实验,所提算法的分类准确度达到90.08%,各类别的平均精准度、召回率、F1-score分别为90.50%,92.00%,90.40%,表明了所提算法的优越性.
文献关键词:
医用光学;图像处理;医学图像处理;视频眼震图分类;时空注意力机制;良性阵发性位置性眩晕;三维卷积神经网络
作者姓名:
周浩军;赵晓丽;高永彬;李海波;程若然
作者机构:
上海工程技术大学电子电气工程学院,上海201600
引用格式:
[1]周浩军;赵晓丽;高永彬;李海波;程若然-.基于注意力机制的视频眼震图分类算法研究)[J].激光与光电子学进展,2022(16):370-379
A类:
视频眼震图分类
B类:
分类算法,算法研究,良性阵发性位置性眩晕,主观性,转动,正常人,轻量级模型,MobileNetV2,细节特征,时空信息,低层,时空注意力模块,合眼,眼球震颤,空间信息,时序信息,通道注意力机制,高级语义特征,调制系数,交叉熵损失函数,别数,复旦大学,眼耳鼻喉科,图数据,召回率,score,医用光学,医学图像处理,时空注意力机制,三维卷积神经网络
AB值:
0.238792
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。