数据受限条件下的多模态处理技术综述|王佩瑾;闫志远;容雪娥;李俊希;路晓男;胡会扬;严启炜;孙显|中国科学院大学电子电气与通信工程学院,北京 100049 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

典型文献

数据受限条件下的多模态处理技术综述

文献摘要：

随着多媒体技术的发展,可获取的媒体数据在种类和量级上大幅提升.受人类感知方式的启发,多种媒体数据互相融合处理,促进了人工智能在计算机视觉领域的研究发展,在遥感图像解译、生物医学和深度估计等方面有广泛的应用.尽管多模态数据在描述事物特征时具有明显优势,但仍面临着较大的挑战.1)受到不同成像设备和传感器的限制,难以收集到大规模、高质量的多模态数据集;2)多模态数据需要匹配成对用于研究,任一模态的缺失都会造成可用数据的减少;3)图像、视频数据在处理和标注上需要耗费较多的时间和人力成本,这些问题使得目前本领域的技术尚待攻关.本文立足于数据受限条件下的多模态学习方法,根据样本数量、标注信息和样本质量等不同的维度,将计算机视觉领域中的多模态数据受限方法分为小样本学习、缺乏强监督标注信息、主动学习、数据去噪和数据增强5个方向,详细阐述了各类方法的样本特点和模型方法的最新进展.并介绍了数据受限前提下的多模态学习方法使用的数据集及其应用方向(包括人体姿态估计、行人重识别等),对比分析了现有算法的优缺点以及未来的发展方向,对该领域的发展具有积极的意义.

文献关键词：

多模态数据;数据受限;深度学习;融合算法;计算机视觉

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

王佩瑾;闫志远;容雪娥;李俊希;路晓男;胡会扬;严启炜;孙显

作者机构：

中国科学院空天信息创新研究院,北京 100190;中国科学院大学电子电气与通信工程学院,北京 100049;中国科学院空天信息创新研究院网络信息体系技术科技创新重点实验室,北京 100190

文献出处：

中国图象图形学报

引用格式：

[1]王佩瑾;闫志远;容雪娥;李俊希;路晓男;胡会扬;严启炜;孙显-.数据受限条件下的多模态处理技术综述)[J].中国图象图形学报,2022(10):2803-2834

A类：

B类：

数据受限,受限条件,技术综述,多媒体技术,媒体数据,知方,多种媒体,互相融合,融合处理,计算机视觉,研究发展,遥感图像,图像解译,深度估计,成像设备,多模态数据集,配成,任一,视频数据,注上,耗费,人力成本,尚待,多模态学习,样本数量,标注信息,小样本学习,主动学习,数据去噪,数据增强,模型方法,最新进展,应用方向,人体姿态估计,行人重识别,融合算法

AB值：

0.350375

相似文献

多模态人体运动同步数据集

程景铭;谢文军;沈子祺;李琳;刘晓平-合肥工业大学计算机与信息学院合肥 230601;合肥工业大学软件学院合肥 230601

多聚点子空间下的时空信息融合及其在行为识别中的应用

杨天金;侯振杰;李兴;梁久祯;宦娟;郑纪翔-常州大学计算机与人工智能学院阿里云大数据学院软件学院常州213164;江苏省物联网移动互联技术工程重点实验室淮安 223003

基于联邦学习的多源异构数据融合算法

莫慧凌;郑海峰;高敏;冯心欣-福州大学物理与信息工程学院福州 350108

新一代知识图谱关键技术综述

王萌;王昊奋;李博涵;赵翔;王鑫-东南大学计算机科学与工程学院南京 211189;同济大学创意设计学院上海 200092;南京航空航天大学计算机学院南京 211106;国防科技大学信息系统工程国家重点实验室长沙 410073;天津大学智能与计算学部天津 300072

深度学习跨模态图文检索研究综述