典型文献
基于CNN与Transformer的无人机图像目标检测研究
文献摘要:
针对无人机航拍图像中存在的密集目标、背景复杂、小目标检测困难、图像尺寸大等问题,提出了卷积神经网络(CNN)与Transformer相结合的无人机图像目标检测算法.该算法在YOLOv5网络的基础上结合了Transformer结构打破了CNN感受野的局限性,凭借自注意力机制捕获全局的依赖关系.同时采用了大尺度的特征图,使用加权双向特征金字塔网络(BiFPN)增强了特征的传播与重用,让网络对小目标的检测能力大大提高.最后使用数据降维与滑动窗口的方法减少网络的内存消耗与计算量.在VisDrone无人机数据集上的实验结果表明所提算法在满足实时性的基础上,平均精确率比YOLOv5网络提高约7%,达到了最先进的42.48%,展现了模型对无人机图像的优秀检测性能.
文献关键词:
深度学习;无人机图像检测;卷积神经网络;目标检测算法;计算机视觉
中图分类号:
作者姓名:
祝星馗;蒋球伟
作者机构:
华北计算技术研究所 系统七部,北京100083
文献出处:
引用格式:
[1]祝星馗;蒋球伟-.基于CNN与Transformer的无人机图像目标检测研究)[J].武汉理工大学学报(信息与管理工程版),2022(02):323-331
A类:
无人机图像检测
B类:
Transformer,图像目标检测,无人机航拍图像,密集目标,小目标检测,图像尺寸,目标检测算法,YOLOv5,感受野,借自,自注意力机制,依赖关系,大尺度,特征图,加权双向特征金字塔网络,BiFPN,重用,检测能力,使用数据,数据降维,滑动窗口,计算量,VisDrone,精确率,最先,检测性能,计算机视觉
AB值:
0.289377
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。