融合双向路由注意力的多尺度X光违禁品检测

发布日期:2024年3月26日
融合双向路由注意力的多尺度X光违禁品检测 融合双向路由注意力的多尺度X光违禁品检测

本内容试读结束

下载后可阅读完整内容,立即下载

针对违禁品检测中存在的复杂背景干扰、物体间的重叠遮挡和多尺度变化问题,提出一种基于改进YOLOv7的X射线违禁品目标检测算法。首先,在主干中引入MBConv,以更有效的捕获全局信息;其次在特征融合网络中加入RFE模块,以增加特征图的感受野,从而提高违禁品多尺度检测的准确性。并设计出一种ELAN-BiF模块,用于抑制复杂背景干扰,使网络提取不同尺度的物品特征;为了提高小目标物体的检测精度,增加了一个微小物体检测头;最后,结合CARAFE上采样和Mish激活函数来提高网络对重叠和遮挡对象的识别能力,并提升在正负样本不平衡情况下的检测能力。结果表明,改进后的模型在SIXray_OOD数据集上进行测试,该方法map达到了95.2%,比原模型提高4.9%,比其他主流检测模型在违禁品检测任务上具有更好的优越性。

在火车站、体育馆、地铁、机场等公共场所中,使用X 射线安检机,可以有效避免枪支、管制刀具等违禁品对人员和公共财产的威胁与干扰[1]。

但目前大多X 射线安检机主要依靠人工视觉从拍摄的图像中识别违禁品,存在人为疏忽而导致漏检和错检的问题。

X 射线安检图像是通过目标检测算法来判断是否存在违禁品,并在安检图像中标记出它的位置和类别[2]。然而,X 射线安检图像有以下特点:1) 复杂背景:由于X 射线成像与物体的密度和厚度有关,安检设备根据物质的性质呈现不同的颜色, 当背景与违禁品厚度和密度相近时, 会干扰违禁品的特征学习;2) 物体间重叠遮挡:物品在X 射线投影下的形状会严重畸变, 被检物品的随机放置会导致物体间的互相遮挡,增加违禁品识别的困难[3];3) 违禁品具有多尺度变化:同类物品在图片中会呈现不同的尺度,不同位置的镜头监测到的目标也会呈现出尺度差异。违禁品检测安检图像如图1 所示。

近年来,随着深度学习在计算机视觉领域发展迅速,目标检测算法在X 射线安检图像违禁品识别中发挥了重要作用,有效提高了违禁品识别的准确率。Akcay [4]等人首次将卷积神经网络应用于X 射线安检图像,通过迁移学习对X 光行李图像进行分类,再对特定物品——手枪进行检测,但识别类别单一;Gaus 等[5]提出了一种双卷积神经网络架构,用于复杂X 射线安检图像中的自动异常检测。GE 等[6]人提出解耦检测头和无瞄框的YOLOX 框架,虽定位多尺度小目标准确,但泛化性不足;Zhang Y [7]等人在FSSD 检测模型上添加扩张卷积并引入残差连接以避免过拟合现象, 但检测精度仍有提升空间;Zhu X [8]等人提出基于注意力机制的多尺度检测网络(AMOD-Net), 通过融入通道注意力、构建深度特征融合结构, 来解决X 光违禁品图像中的重叠遮挡问题,但多尺度检测网络导致特征模糊,从而影响检测精度; 上述研究成果极大推动了深度学习在X 光违禁品检测中的应用,提高了违禁品检测的准确性。但X射线安检图像仍存在违禁品的形状多尺度、重叠遮挡严重、复杂背景干扰等急需解决的关键问题,目前的检测精度和速度仍然无法满足实际应用的要求。



相关标签