典型文献
面向复杂场景的人物视觉理解技术
文献摘要:
面向复杂场景的人物视觉理解技术能够提升社会智能化协作效率,加速社会治理智能化进程,并在服务人类社会的经济活动、建设智慧城市等方面展现出巨大活力,具有重大的社会效益和经济价值.人物视觉理解技术主要包括实时人物识别、个体行为分析与群体交互理解、人机协同学习、表情与语音情感识别和知识引导下视觉理解等,当环境处于复杂场景中,特别是考虑"人物—行为—场景"整体关联的视觉表达与理解,相关问题的研究更具有挑战性.其中,大规模复杂场景实时人物识别主要集中在人脸检测、人物特征理解以及场景分析等,是复杂场景下人物视觉理解技术的重要研究基础;个体行为分析与群体交互理解主要集中在视频行人重识别、视频动作识别、视频问答和视频对话等,是视觉理解的关键行为组成部分;同时,在个体行为分析和群体交互理解中,形成综合利用知识与先验的机器学习模式,包含视觉问答对话、视觉语言导航两个重点研究方向;情感的识别与合成主要集中在人脸表情识别、语音情感识别与合成以及知识引导下视觉分析等方面,是情感交互的核心技术.本文围绕上述核心关键技术,阐述复杂场景下人物视觉理解领域的研究热点与应用场景,总结国内外相关成果与进展,展望该领域的前沿技术与发展趋势.
文献关键词:
复杂场景;视觉理解;人物识别;深度学习;行为分析
中图分类号:
作者姓名:
马利庄;吴飞;毛启容;王鹏杰;陈玉珑
作者机构:
上海交通大学,上海 200240;浙江大学,杭州 310058;江苏大学,镇江 212013;大连民族大学,大连 116600
文献出处:
引用格式:
[1]马利庄;吴飞;毛启容;王鹏杰;陈玉珑-.面向复杂场景的人物视觉理解技术)[J].中国图象图形学报,2022(06):1723-1742
A类:
视觉理解,视频问答
B类:
复杂场景,理解技术,社会智能,加速社会,社会治理智能化,经济活动,智慧城市,时人,人物识别,个体行为,行为分析,群体交互,交互理解,人机协同学习,语音情感识别,知识引导,整体关联,视觉表达,表达与理解,人脸检测,场景分析,视频行人重识别,视频动作识别,关键行为,先验,学习模式,视觉问答,答对,视觉语言,人脸表情识别,视觉分析,情感交互,前沿技术
AB值:
0.287481
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。