首站-论文投稿智能助手
典型文献
基于音视一致性的音视人眼关注点检测
文献摘要:
现有音视人眼关注点检测算法使用双流结构分别对音视信息进行特征提取,随后对音视特征融合得到最终的预测图.但数据集中的音频信息和视觉信息会有不相关的情况,因此在音视不一致时直接对音视特征进行融合会使得音频信息对视觉特征产生消极的影响.针对上述问题,本文提出一种基于音视一致性的音视人眼关注点检测网络(Audio-vis-ual Consistency Network,AVCN).为验证该网络的可靠性,本文在现有音视结合的人眼关注点检测模型上加入音视一致性网络,AVCN对提取的音、视频特征进行一致性二值判断,二者一致时,输出音视融合特征作为最终的预测图,反之则输出视觉占主导的特征作为最终结果.该算法在开放的6个数据集上进行实验,结果表明加入AVCN模型的整体指标会有所提高.
文献关键词:
计算机视觉;人眼关注点检测;音视一致性
作者姓名:
袁梦;于小雨
作者机构:
青岛大学计算机科学技术学院,山东 青岛 266071
文献出处:
引用格式:
[1]袁梦;于小雨-.基于音视一致性的音视人眼关注点检测)[J].计算机与现代化,2022(04):103-109
A类:
音视一致性,人眼关注点检测,AVCN
B类:
检测算法,双流结构,对音,特征融合,音频信息,视觉信息,不相关,合会,对视,视觉特征,生消,测网,Audio,vis,ual,Consistency,Network,检测模型,融合特征,反之,整体指标,标会,计算机视觉
AB值:
0.245504
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。