多模态信息处理前沿综述:应用、融合和预训练|吴友政;李浩然;姚霆;何晓冬 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

多模态信息处理前沿综述:应用、融合和预训练

文献摘要：

随着视觉、听觉、语言等单模态人工智能技术的突破,让计算机拥有更接近人类理解多模态信息的能力受到研究者们的广泛关注.另一方面,随着图文社交、短视频、视频会议、直播和虚拟数字人等应用的涌现,对多模态信息处理技术提出了更高要求,同时也给多模态研究提供了海量的数据和丰富的应用场景.该文首先介绍了近期自然语言处理领域关注度较高的多模态应用,并从单模态的特征表示、多模态的特征融合阶段、融合模型的网络结构、未对齐模态和模态缺失下的多模态融合等角度综述了主流的多模态融合方法,同时也综合分析了视觉-语言跨模态预训练模型的最新进展.

文献关键词：

多模态信息处理;多模态融合;多模态预训练;自然语言处理

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 文字信息处理（TP391.1）

[3] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

作者姓名：

吴友政;李浩然;姚霆;何晓冬

作者机构：

京东人工智能研究院,北京 100101

文献出处：

中文信息学报

引用格式：

[1]吴友政;李浩然;姚霆;何晓冬-.多模态信息处理前沿综述:应用、融合和预训练)[J].中文信息学报,2022(05):1-20

A类：

多模态信息处理

B类：

听觉,单模,图文,文社,视频会议,虚拟数字人,信息处理技术,自然语言处理,特征表示,特征融合,融合模型,对齐,多模态融合,融合方法,跨模态,预训练模型,最新进展,多模态预训练

AB值：

0.201932

相似文献

计算机辅助血管介入技术进展综述

李娜;贺建安;陈阳;周寿军-中国科学院深圳先进技术研究院生物医学与健康工程研究所深圳 518055;中国科学院大学北京 100049;东南大学计算机科学与工程学院南京 211189

面向突发事件画像的社交媒体图像分类研究

李纲;张霁;毛进-武汉大学信息资源研究中心武汉430072

重大突发公共卫生事件下的公众情感演进分析:基于新冠肺炎疫情的考察

边晓慧;徐童-安徽大学管理学院合肥 230039;中国科学技术大学计算机科学与技术学院合肥 230027

IMTS:融合图像与文本语义的虚假评论检测方法

施运梅;袁博;张乐;吕学强-北京信息科技大学网络文化与数字传播北京市重点实验室北京100101;北京信息科技大学计算机学院北京100101

在线评论可行动信息识别研究

商丽丽;唐华云;王延昭;左美云-中央国债登记结算有限责任公司博士后科研工作站北京100033;中国人民大学信息学院北京100871;中债金科信息技术有限公司区块链实验室北京100044

基于跨模态深度学习的旅游评论反讽识别

刘洋;马莉莉;张雯;胡忠义;吴江-武汉大学信息管理学院武汉430072;武汉大学电子商务研究与发展中心武汉430072;武汉大学经济与管理学院武汉430072

面向深度学习的多模态情感识别研究进展

赵小明;杨轶娇;张石清-浙江科技学院理学院,杭州 310000;台州学院智能信息处理研究所,浙江台州 318000

表情识别技术综述

洪惠群;沈贵萍;黄风华-阳光学院人工智能学院,福州 350015;阳光学院空间数据挖掘与应用福建省高校工程研究中心,福州 350015;阳光学院福建省空间信息感知与智能处理重点实验室,福州 350015

基于多模态深度融合的虚假信息检测

孟杰;王莉;杨延杰;廉飚-太原理工大学大数据学院,太原030600;北方自动控制技术研究所,太原030006

基于多模态信息融合的时间序列预测模型

吴明晖;张广洁;金苍宏-浙大城市学院计算机与计算科学学院,杭州310015;浙江大学计算机科学与技术学院,杭州310027

融合多模态深度游走与偏差校准因子的推荐模型

武子腾;宋承云-重庆理工大学计算机科学与工程学院,重庆400054

多模态融合网络的睡眠分期研究

陈玲玲;毕晓君-哈尔滨工程大学信息与通信工程学院,黑龙江哈尔滨150001;中央民族大学信息工程学院,北京100081

基于矩阵分解双线性池化的多模态融合虚假新闻检测

王婕;刘芸;纪淑娟-山东科技大学山东省智慧矿山信息技术重点实验室,山东青岛266590

融合注意力机制的互补产品推荐方法

王梦茹;纪淑娟;梁永全;刘广明-山东科技大学计算机科学与工程学院,山东青岛266590

基于对偶变分多模态注意力网络的不完备社会事件分类方法

周旭;钱胜胜;李章明;方全;徐常胜-郑州大学河南先进技术研究院郑州450000;中国科学院自动化研究所模式识别国家重点实验室北京100190

基于多模态融合与多层注意力的视频内容文本表述研究

赵宏;郭岚;陈志文;郑厚泽-兰州理工大学计算机与通信学院,兰州 730050

拥抱融合的多模态灾害分析算法

梅欣;缪梓敬-华南师范大学计算机学院,广东广州 510631

自然语言处理新范式:基于预训练模型的方法

车万翔;刘挺-哈尔滨工业大学,中国哈尔滨150001

基于注意力机制的多模态融合谣言检测方法

戚力鑫;万书振;唐斌;徐义春-三峡大学计算机与信息学院,湖北宜昌 443000

融合ELMo词嵌入的多模态Transformer的图像描述算法

杨文瑞;沈韬;朱艳;曾凯;刘英莉-昆明理工大学信息工程与自动化学院,昆明 650500;昆明理工大学云南省计算机重点实验室,昆明 650500

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。