首站-论文投稿智能助手
典型文献
基于多模态融合的视频情感分析技术
文献摘要:
介绍一种视频多模态情感识别方法.一个视频通常通过文本、声音和视觉图像等多模态信息来表达同一种情感主题,而如何将同一个视频中不同异构数据之间的信息融合并最大程度地利用是目前需要重点攻克的难题.通过互信息最大化的方法,高效融合视频中的文本、声音与视觉图像等多模态异构数据,尽可能多地消除模态之间的差异,最终实现对视频的情感进行识别分析.在公开的MOSEI多模态数据集上进行实验,实验结果显示MAE值达55.4.相比之前的一些模型,本模型效果更优,且实验模型构造不繁琐,为后面相关的研究打下良好的基础.
文献关键词:
多模态融合;视频情感分析;互信息最大化
作者姓名:
陈诗汉;马洪江;王婷;何松泽
作者机构:
成都信息工程大学计算机学院,四川 成都610200
引用格式:
[1]陈诗汉;马洪江;王婷;何松泽-.基于多模态融合的视频情感分析技术)[J].成都信息工程大学学报,2022(06):656-661
A类:
视频情感分析
B类:
多模态融合,多模态情感识别,视觉图像,多模态信息,情感主题,同一个,异构数据,信息融合,攻克,互信息最大化,高效融合,对视,识别分析,MOSEI,多模态数据集,MAE,实验模型,模型构造,不繁,后面
AB值:
0.340559
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。