典型文献
基于注意力机制的多模态自动驾驶行为决策模型
文献摘要:
针对现有端到端自动驾驶模型未考虑驾驶场景中不同区域的重要性和不同语义类别之间的关系而导致预测准确率低的问题,受驾驶人注意力机制和现有端到端自动驾驶模型的启发,充分考虑驾驶场景的动态变化、驾驶场景的语义信息和深度信息对驾驶行为决策的影响,以连续多帧驾驶场景的RGB图像为输入,构建一种基于注意力机制的多模态自动驾驶行为预测模型,实现对方向盘转角和车速的准确预测.首先,通过语义分割模型和单目深度估计模型分别获取RGB图像的语义图像和深度图像;其次,为剔除与驾驶行为决策无关信息,以神经科学和空间抑制理论为基础,设计一种拟人化注意力机制作为能量函数来计算驾驶场景中不同区域的重要度;为学习语义图像中与驾驶行为决策最为相关类别之间的关系,采用图注意力网络(Graph Attention Network,GAT)对驾驶场景的语义图像进行特征提取;然后,以保留RGB特征为原则对提取的驾驶场景的图像特征、语义特征和深度特征进行融合,采用卷积长短期记忆网络(Convolutional Long Short Term Memory,ConvLSTM)实现融合特征在连续多帧之间的传递,进而实现下一帧驾驶场景对应驾驶行为的预测;最后,与其他模型的对比试验、消融试验、泛化试验和特征可视化试验来充分验证所提出自动驾驶行为预测模型的性能.试验结果表明:与其他驾驶行为预测模型相比,所提出模型的训练误差为0.021 2,预测准确率为86.97%,均方误差为0.031 5,其驾驶行为的预测性能优于其他模型;连续多帧的语义图像和深度图像、拟人化注意力机制和面向语义特征提取的GAT有助于提升驾驶行为预测的性能;该模型具有较好的泛化能力,其做出驾驶行为预测所依赖的特征与经验丰富的驾驶人所关注的特征基本一致.
文献关键词:
汽车工程;自动驾驶模型;注意力机制;驾驶行为;多模态
中图分类号:
作者姓名:
郭应时;黄涛
作者机构:
长安大学汽车学院,陕西西安 710064
文献出处:
引用格式:
[1]郭应时;黄涛-.基于注意力机制的多模态自动驾驶行为决策模型)[J].中国公路学报,2022(09):141-156
A类:
自动驾驶模型
B类:
注意力机制,驾驶行为决策,决策模型,端到端自动驾驶,驾驶场景,语义类别,预测准确率,驾驶人,语义信息,深度信息,多帧,RGB,行为预测,方向盘,车速,准确预测,语义分割,分割模型,单目深度估计,语义图,深度图像,神经科学,抑制理论,拟人化,能量函数,重要度,习语,图注意力网络,Graph,Attention,Network,GAT,图像特征,语义特征,深度特征,卷积长短期记忆网络,Convolutional,Long,Short,Term,Memory,ConvLSTM,融合特征,一帧,特征可视化,可视化试验,出模,均方误差,预测性能,泛化能力,经验丰富,特征基,汽车工程
AB值:
0.288736
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。