基于深度学习的口罩佩戴识别技术研究

发布日期:2023年9月26日
基于深度学习的口罩佩戴识别技术研究 基于深度学习的口罩佩戴识别技术研究

本内容试读结束

下载后可阅读完整内容,立即下载

本文基于目标检测中口罩佩戴识别的相关研究,针对人群环境下口罩佩戴检测时中小尺寸目标识别等问题,通过在原网络中用稠密模块代替原有的残差模块以及优化损失函数对YOLOv3模型进行改进。实验结果表明,改进后的算法识别平均精度达到95.35%,相较于原YOLOv3算法提升了4.49%,同时该算法还具有较高的检测速度,能够满足实时检测的需求,在实际应用中可以将其嵌入移动式设备,能够有效解放人力,减少管理成本。

自2019 年末以来, 新型冠状病毒以极快的传播速度在全球肆意蔓延,给各地疫情防控工作带来了巨大的挑战。在这一背景下,全球范围内推广佩戴口罩成为一项重要的防控措施,它能有效地阻隔空气中的飞沫以及游离病毒进入呼吸道,从而减少感染几率。如在人口密集的公共场所(机场、车站、商场、学校等)应用口罩佩戴识别系统可以帮助卫生部门和政府实时监测佩戴率,提前发现和控制潜在的传染风险,从而保障公众健康安全。

目前有两种主要的目标检测算法,一种是基于图像处理的传统目标检测算法,另一种是基于卷积神经网络的目标检测算法。

传统的目标检测算法通过不同尺寸的滑动窗口或图像分割技术形成大量候选框, 在对每个区域的图像特征,如方向梯度直方图、尺度不变特征[1]进行提取之后,传递给分类器,如支持向量机(SVM) [2]、K 近邻(KNN)、决策树(Decision Tree)等对该候选区域的分类。由于使用人工提取特征的方法,传统的目标检测存在特征表达能力弱、检测准确度不高、窗口冗余等问题。随着深度学习技术的不断发展,基于深度学习的目标检测算法在准确率和效率方面持续改进,成为目前主流的研究方向。

其中,著名的算法包括Faster R-CNN、YOLO (You Only Look Once)、SSD (Single Shot Multibox Detector)等。这些方法能够高效地检测图像中的目标,并且在复杂场景下表现较好。YOLOv3 是YOLO 系列的第三代算法,最早由Joseph Redmon 等人在2018 年提出[3]。自发布以来,许多研究人员对YOLOv3 进行了优化和改进。如张富凯等人在YOLOv3 网络的基础上,提出了改进的快速车辆检测方法[4],孙迎春等人提出了交通灯检测算法[5], 葛雯等人提出了行人识别算法[6], 这些改进后的YOLOv3 算法在特定场景下表现出了不错的检测效果。

本文针对人群环境下口罩佩戴检测中存在的中小尺寸目标等问题,对基于YOLOv3 算法的模型进行改进与优化,以实现人群口罩佩戴检测任务。

2. 基于YOLOv3 的改进目标检测识别算法 2.1. YOLOv3 模型简介 YOLOv3 是单阶段检测的一种经典算法,它的优点在于简化了目标识别过程,直接通过对视频、实时源、图像等进行卷积网络回归而实现对物体的检测,大幅度提高了检测的效率,具有优异的时效性。

YOLOv3 主干网络采用了darknet-53 网络,一共提取了三个特征层进行目标检测,分别位于主干特征提取网络的中间层、中下层和底层,用于对大、中、小目标物体进行多尺度的检测。为了获得更强的特征表现力,将3 个不同尺寸的特征图进行特征融合,中间经过上采样以及下采样,使特征图大小相同, 然后进行堆叠、融合及相应的卷积等操作后,得到最终的3 个特征层。结构图1 中,DBL 为YOLOv3 的基本组件,在卷积部分使用了特有的DarkNetconv2D 结构,卷积后进行了标准化与Leaky ReLU 激活。

另外,YOLOv3 最重要的改进为引用了ResNet 深度残差网络,通过使用这种改进措施可以增加网络结构



相关标签