近年来,基于计算机视觉技术的行人检测方法一直是智能交通领域研究的热点问题之一。基于HOG和局部自相似(LSS)特征融合的行人检测算法在检测效果上优于传统HOG特征的行人检测算法,但是同时也存在如下挑战:1) 算法检测的速度不够快;2) 在遮挡面积过大的情况下,无法有效地进行处理。针对这些挑战问题,本文提出了一种使用BING特征、HOG-LSS特征和数据轨迹融合的行人检测优化框架,并通过对实验结果进行验证可知,检测效果优于HOG-LSS特征的行人检测方法。
行人检测,顾名思义,就是把图像或视频中出现的行人从背景中分割出来,并精确定位。近年来, 基于计算机视觉技术的行人检测方法一直是智能交通领域研究的热点问题之一,除此之外,它还广泛的应用于智能监控领域,对视频监控场景区域内的可疑人物或事件进行检测、识别和报警,可以有效的阻止犯罪和异常事件的发生。另外,行人检测在人机交互、虚拟现实、医学图像、机器人视觉导航等也应用非常广泛。
目前,行人检测方法主要有背景差分和帧间差分的行人检测方法、模板匹配的行人检测方法、基于光流的行人检测方法以及基于机器学习的行人检测,由于利用机器学习的思想来解决由环境变化、行人衣着和形态变化给检测带来的影响,所以这种行人检测方法已经成为视频行人检测领域中最活跃的主流研究方向, 它主要包括特征提取和机器学习两部分。
2005 年, Dalal [1]等提出了梯度方向直方图(histograms of oriented gradient, HOG)特征和支持向量机(support vector machine, SVM)分类器的行人检测方法, 并试验中取得了很好的表现,但是对于遮挡和复杂背景下的行人检测效果差,所以随之又有一些新的论文的出现[2] [3] [4],比如局部自相似(local self-similar, LSS)特征[5]就是通过捕捉图像颜色自相似性、边缘特征和重复模板以及复杂的纹理来计算两幅图像的相似性。在行人检测上的分类器主要有SVM 和AdaBoost两种, Maji [6]等采用了一种新的核SVM 方法来检测行人, 叫做直方图交叉核SVM (histogram intersection kernel support vector machine, HIKSVM),这种方法不但可以快速检测到行人,并且检测精度还有提升。
朱文佳等提出了一种Gentle Adaboost 的分类方法,且成功地应用到行人检测上。种衍文等[7]提出的采用多特征结合Adaboost 和SVM 的两级行人检测算法,也取得了不错的效果。
但是,由于原有的算法存在速度不够快且无法有效的处理遮挡等问题,所以本文提出了基于BING (binarized normed gradients, BING)特征[8]和HOG-LSS 特征的数据轨迹融合的行人检测优化框架。
实验证明,该框架不仅能改进现有的行人检测算法的检测性能,还能大大提高检测速度。
2. 本文的行人检测框架与以前框架对比 如图1 所示,传统的行人检测框架是直接利用行人检测算法(HOG-LSS)对输入图片进行检测,再输出结果。
但是, 如图2 所示, 对于使用BING 特征和数据融合的行人检测优化框架针对HOG-LSS 速度不够快的问题,可以优化成三个步骤:1) 首先,使用BING 进行粗检测,在保证精度的前提之前快速过滤