首站-论文投稿智能助手
典型文献
变分推断域适配驱动的城市街景语义分割
文献摘要:
街景语义分割技术旨在从图像中识别分割出行人、障碍物、道路、标志物等要素,为车辆提供道路上自由空间的信息,是自动驾驶的关键技术之一.高性能的语义分割系统非常依赖于训练时所需的大量真实标注数据,然而为图像中的每个像素进行标注成本很高,往往难以实现.一种低成本获取标注数据的方法是利用视频游戏收集逼真且标注成本低的合成图片,来帮助机器学习模型对现实世界中的图片作语义分割,这对应域适配技术.与当前基于VC维理论或Rademacher复杂度理论的主流语义分割域适配方法不同,受基于PAC-Bayes理论的兼容伪标签函数的域适配目标域Gibbs风险上界启发,考虑假设空间的平均情况而非最差情况,以避免主流方法过度约束隐空间上的领域差异,从而导致目标域泛化误差上界未能被有效估计并优化的问题.在上述思想的指导下,提出了一种变分推断语义分割域适配方法(VISA),该方法在利用Dropout变分族进行变分推断求解假设空间上的理想后验分布的同时能快速得到一个近似Bayes分类器,并通过目标域熵最小化和筛选像素点使得对风险上界的估计更加准确.在街景语义分割数据集GTA5→Cityscapes上的适配的实验结果表明,VISA方法相比基线方法平均交并比提高了0.5%6.6%,且在行人、车辆等关键街景要素上具有较高的识别准确率.
文献关键词:
语义分割;域适配;PAC-Bayes理论;变分推断;深度神经网络
作者姓名:
金玉杰;初旭;王亚沙;赵俊峰
作者机构:
高可信软件技术教育部重点实验室(北京大学) 北京 100871;北京大学计算机学院 北京 100871;清华大学计算机系 北京 100084;北京大学软件工程国家工程研究中心 北京 100871
文献出处:
引用格式:
[1]金玉杰;初旭;王亚沙;赵俊峰-.变分推断域适配驱动的城市街景语义分割)[J].计算机科学,2022(11):126-133
A类:
标签函数
B类:
变分推断,域适配,城市街景,语义分割技术,割出,障碍物,上自,自由空间,自动驾驶,难以实现,视频游戏,逼真,合成图片,机器学习模型,现实世界,VC,Rademacher,复杂度理论,配方法,PAC,Bayes,伪标签,目标域,Gibbs,上界,主流方法,隐空间,域泛化,泛化误差,有效估计,断语,VISA,Dropout,后验分布,分类器,过目,像素点,GTA5,Cityscapes,比基,平均交并比,识别准确率,深度神经网络
AB值:
0.37092
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。