无人机的广泛应用使得低空空域的安全性成为了社会关注的焦点,由于低空空域的复杂性和不可预测性,有效的安全检测变得尤为迫切。在这个背景下,基于AD-YOLOv5s的无人机低空安全检测技术崭露头角,AD-YOLOv5s作为一种基于深度学习的目标检测框架,以其高度的准确性和实时性在多个领域取得了显著成果。这一技术的核心优势在于其能够高效地识别和追踪低空环境中的潜在风险,通过结合实时感知和深度学习算法,AD-YOLOv5s可以准确地识别无人机、障碍物、飞行器件等各种目标,从而实现对低空空域的全面监控。无论是在城市区域还是农田地带,该技术都能够为无人机操作员提供及时的安全警示,有助于避免潜在的事故和碰撞。01算法框架将YOLOv5s模型应用于低空小型无人机检测时,面临着两个主要问题,一是低空小型无人机的检测场景中,物体尺寸分布极不均匀,其中包含大量的小物体,甚至有比这些小物体还要微小的物体存在,即微小物体。现有的YOLOv5s检测模型在小尺寸物体和微小物体的检测方面表现不佳,因此需要根据低空小型无人机检测的物体尺寸分布进行模型的优化。二是低空小型无人机检测场景通常需要在低成本边缘设备上进行支持,虽然YOLOv5s模型相对于YOLOv5家族中的其他模型来说较为轻量,但由于低成本边缘设备的内存和计算资源有限,直接在这些设备上部署该模型可能无法充分发挥其性能。为了在这些资源受限的边缘设备上实现高效的检测,研究人员对YOLOv5s模型进行了特征增强和网络结构轻量化的优化,最终提出了经过改进的AD-YOLOv5s模型。通过结合物体尺寸分布优化和轻量化网络结构设计,AD-YOLOv5s模型能够更好地适应低空小型无人机检测的挑战,提高了对微小物体的检测能力,并且在资源受限的边缘设备上也能获得更好的性能表现。02特征融合层的特征增强通常普通的YOLOv5s模型在物体检测过程中使用了8倍下采样、16倍下采样和32倍下采样的特征图作为预测层。这些特征图中包含了图像的浅层特征,如轮廓、边缘、颜色、纹理和形状特征,其中边缘和轮廓可以很好地反映图像的内容,虽然低层特征的语义信息较少,但在目标定位方面表现较准确。普通的YOLOv5s模型在使用多次下采样后,会丢失浅层特征信息,这会影响小型无人机检测的精度。这种模型默认的输入大小为640 × 640,经过8次下采样可以得到80 × 80的特征图,但由于一个特征图像素对应于输入图像的八个像素,这意味着模型可以检测的最小物体尺寸为8 × 8。在低空小型无人机检测中,由于待检测物体通常较小,甚至有微小物体,这导致了模型无法很好地检测小尺寸物体,因为它们的特征信息在下采样中丢失。原始的YOLOv5s模型采用了三个尺寸的检测头,可以检测8 8及以上尺寸的目标,这也意味着在经过32倍下采样后,模型无法有效地检测到尺寸小于8 8的微小物体,这对于低空安防场景下小型无人机的检测构成了挑战,因为这些无人机通常具有体积小、可用特征少的特点。为了解决之前提到的问题,研究团队进行了一系列优化措施,以提高对微小物体的检测能力,他们增加了专门用于检测微小物体的检测层,同时保留了用于检测小型和中型物体的检测层,但删除了用于检测大型物体的检测层。这些检测层的特征图源自特征融合层,因此在进行检测层的修改后,相应地对特征融合层进行了优化以增强特征。始的YOLOv5s模型使用了特征金字塔网络(FPN)和路径聚合网络(PAN)的结构,为了适应微小物体的检测需求,研究团队在FPN层之后添加了自下而上的特征金字塔,特征金字塔包括两个PAN结构,通过这种优化,特征融合层的网络结构得以提升。在FPN结构中,研究团队在两次上采样后又添加了新的上采样操作,FPN层的金字塔结构从最初的三层改进为四层,通过特征提取层对相同尺寸的特征图进行Concat操作,得到了尺寸为160 160的特征图,用于微小物体的检测。虽然预测层没有使用20 20的特征图,但是FPN层仍然保留了这个特征图,以便提取更详细的语义特征,并将其传递到具有FPN结构的其他特征图中,从而有利于微小物体的检测。两个PAN结构被添加到160 160的特征图后,分别生成80 80和40 40的特征图,FPN层用于传递强语义特征自上而下,而PAN层则用于传递强定位特征自下而上,这进一步增强了特征融合层的性能。对应的研究团队还对检测头层进行了优化,他们保留了两个检测头,用于从80 80和40 40的特征图中检测中型和小型物体。03轻量化模型设计为了在物体检测中优化特征提取网络,研究团队引入了Ghost模块,以减少计算量同时保留重要特征信息,在传统的特征提取中,常规的卷积核被用于对输入图像进行卷积操作,生成相应数量的特征图。他们采用了Ghost模块来重新构建特征提取网络的主干,Ghost模块通过一种新的卷积方法来生成冗余特征图,从而有效地减少模型的参数数量,同时不丢失关键的特征信息,这种方法能够显著减少模型的计算量。Ghost模块的工作原理如下:使用少量的常规卷积生成少量特征图,然后使用这些特征图进行线性运算,生成相似的特征图,将这两组特征图进行组合,形成最终的特征信息输出。举例来说,如果常规卷积生成了36个特征图,在应用Ghost模块时,首先会生成6个特征图,然后每个特征图会映射到5个相似的特征图,这个方法将模型的计算量减少了6倍,同时有效解决了冗余特征图对计算资源的占用问题。YOLOv5s的特征提取网络采用了四层常规卷积和三层卷积融合的跨级局部瓶颈网络,直接用Ghost模块替换bottleneckCSP结构和常规卷积会带来模型计算量的大幅增加和梯度信息的重复问题。为了解决这些问题,研究团队采用了一种策略:将256维通道的输入特征图通过1×1×64的卷积层处理,然后使用3×3×64的卷积层,最后再经过1×1×256的卷积层,这种瓶颈结构卷积的参数数量仅为常规卷积的11.8%,有助于降低模型的参数数量。在YOLOv5s的特征融合网络中,存在四个CBL结构,这实际上就是指特征融合网络中的常规卷积层。传统的常规卷积会导致参数量庞大,从而难以在低成本的边缘设备上进行有效部署,因此为了在保持性能的同时减少模型的复杂性,有必要对传统卷积进行轻量级改进。鉴于已有的研究成果,一种可行的方法是采用深度可分离卷积(DSConv)38来取代传统的卷积操作。这样的操作可以显著降低卷积操作中的参数数量,从而实现更轻量级的模型设计,DSConv是一种卷积操作,它将卷积过程分为两个步骤:深度卷积和逐通道卷积,这种分解减少了参数的冗余性,使得模型在保持性能的情况下更加高效。在特征融合网络中,传统的常规卷积被深度可分离卷积所替代,这个改进不仅降低了参数量,还增加了模型在低成本边缘设备上的部署可能性,通过这种方式模型在保证检测性能的同时,变得更加适合于实际应用。04实验结果与分析研究旨在针对低空小型无人机开展目标检测,但目前缺乏适用的相关数据集,研究团队在Google提供的无人机数据集的基础上进行了数据集的改进和扩充。最初的数据集包含9000张不同环境下的民用无人机图像,研究团队对数据集进行了过滤,排除了不符合要求的检测图像。他们从网络上搜集相关图片,对数据集进行了扩充,此外,还从一些无人机视频中截取了图像,进一步扩充了数据集,通过这些步骤他们构建了一个名为AntiDrone的数据集,其中包含7500张图像,其中6750张用于模型的训练,而剩下的750张则用于测试和验证模型的效果。在研究中,对比了不同模型的性能,引入了CBAM注意力机制的模型被称为CBAM-YOLOv5s,优化特征融合层的模型被命名为improved-YOLOv5s,而将结构轻量化设计和特征增强相结合的模型则被称为AD-YOLOv5s。与传统的YOLOv5s模型相比,引入了CBAM注意力机制的CBAM-YOLOv5s在多个指标上实现了显著的提升,平均精确度(mAP)、召回率(Recall)以及在不同IoU阈值下的指标均有所改善,具体来说,CBAM-YOLOv5s的mAP提高了2.3%。研究结果表明,引入CBAM注意力机制可以有效增强特征提取能力,从而提高小型无人机目标的检测性能。这一系列的探索与改进,对于解决低空小型无人机目标检测问题具有重要意义,通过数据集的优化和模型的增强,研究团队为实际应用中的无人机监测安全提供了有力的技术支持。基于AD-YOLOv5s的无人机低空安全检测技术为现代无人机操作带来了显著的进步和改善,在保障低空空域安全方面,这一创新性技术通过深度学习的方法,实现了目标的高效检测和精准定位,无人机操作员能够更加全面地了解周围环境,并及时做出响应,避免潜在的风险和碰撞。这不仅有助于保障无人机操作的安全性,也为低空空域的可持续利用提供了一种新的可能性,通过结合深度学习的强大能力和实时感知的优势,该技术有望在无人机领域持续发挥重要作用。技术的发展永远都是一个不断迭代的过程,基于AD-YOLOv5s的无人机低空安全检测技术也需要在实际应用中不断优化和完善,从数据质量到算法精度,都需要持续的努力和改进,同时,与法规、伦理等问题的结合也需要被充分考虑,以确保技术的合法性和可持续性。(图片来源网络,侵删)
文 |古轩说史编辑 | 古轩说史
0 评论