基于改进YOLO V3算法的室内人数统计模型

发布日期:2023年1月3日
基于改进YOLO V3算法的室内人数统计模型 基于改进YOLO V3算法的室内人数统计模型

本内容试读结束

下载后可阅读完整内容,立即下载

基于机器学习与深度学习的目标检测方法被广泛应用于人数统计,然而实际检测区域往往存在人群相互遮挡,或光照不均匀等情况时,人数统计仍然面临很大挑战。为此,提出了一种改进的YOLO V3模型,使其更好的适应室内人群的人数统计。首先自建并丰富了数据集,增加了训练数据的多样性,并通过K-means算法重新聚类锚框;其次,提出了F-YOLO V3模型,该模型中增加104 × 104尺寸的特征图输出并取消13 × 13尺寸特征图的输出;将原网络每一层上采样后的特征图继续上采样,得到的特征图与原网络相应尺寸的特征图进行拼接;并将输出层前的5个卷积变成了1个卷积和2个残差单元,提取更多特征信息,增强对模糊或者较小目标检测能力;最后增加一个ADIOU Loss分支衡量检测框的定位准确度。实验结果表明,F-YOLO V3模型具有更高的召回率和平均精度,室内场景下的人员统计性能得到显著提升。

目标检测是目前计算机视觉和数字图像处理领域的一个重要研究方向,在目标检测的实际应用场景中,室内人数统计一直以来都是一个具有挑战性的问题。像教室、商超、银行及候车室等地方,都需要进行人数的统计,这些场所往往人数较多,位置分散,且监控画面往往是俯拍角度,所以视频中的人像较小的同时也存在相互遮挡问题,因此如何有效的进行特征提取,提高室内人数统计的准确度不仅具有理论意义,也具有重要的实用价值。

目前基于深度学习[1] [2] [3] [4]且应用前景[5] [6]比较广泛的目标检测[7] [8] [9]算法可以分为两类:1) 两阶段目标检测算法:基于Region Proposal 的R-CNN (Region-Convolutional Neural Network) [10]系列算法,需要先产生目标候选框,卷积神经网络对候选框做分类与回归。常见的算法有Fast R-CNN [11]、SPP-Net [12]、Corner-Net [13]、Faster R-CNN [14]、Mask R-CNN [15]等。2) 一阶段目标检测算法:不需要产生候选框,仅使用卷积神经网络直接将目标框定位问题转化为回归问题,预测不同目标的类别与位置。

常见的算法有YOLO (You Only Look Once)系列[16] [17] [18]、SSD (Single Shot MultiBox Detector) [19]等。基于候选框的两阶段方法,经过两次分类和位置回归,在检测准确率和定位精度上占优。由于存在选框和检测两个阶段,会比一阶段算法效率低,而室内人数统计往往需要满足实时性,因此一阶段目标检测算法更适合用来进行人数统计。

近年来, 用目标检测进行人数统计的研究取得了一定的突破, 陈晓[20]等人针对目标检测中的误检漏检问题,提出了一种基于视频的人数统计方法,通过对特征提取、损失函数以及后处理阶段的改进,使得检测准确率以及召回率有一定提高, 且处理速度较快。

成玉荣[21]等人为了统计当前监控环境下的人数,



相关标签