自然图像中的背景包含了丰富的信息,在进行显著性目标检测时,如果处理不当,会影响检测结果的准确性。为了减少背景对检测的影响,本文结合背景信息特征提出了一种相邻像素优化的图像显著性目标检测方法。首先提取背景的统计信息和结构信息构建初始的显著性图;然后,利用保边平滑滤波器对初始显著图进行优化,加强目标区域的细节信息,获得轮廓较为清楚的显著图;最后,根据相邻像素之间的影响,建立相邻像素之间的关系对显著图做进一步优化,得到最终显著图。在两种公开的数据集上测试,并与四种经典的显著性检测算法对比,采用精确率–召回率曲线和F-measure图对算法进行评估,结果显示,本文提出的算法生成的显著图效果更好,检测的准确性更高。
显著性目标检测是根据人类视觉注意机制, 从图像中检测并分割出最吸引人的区域[1] [2]。
近年来在计算机视觉领域有着广泛的应用,通常作为图像分割[3] [4]、视觉跟踪[5] [6] [7]、视频压缩[8] [9] [10]等的预处理阶段。
在显著性检测的研究过程中, 研究者提出了许多显著性检测的方法, 通常可以分为两类[11] [12] [13]:自下而上和自上而下。自下而上的方法利用先验知识和深度学习方式来完成检测,这类方法一般效果较好,能很好的突出显著性区域,但是要执行大量的训练,软硬件要求高,特别是数据收集。与自上而下的方法相比, 自上而下的方法不需要数据收集和训练过程, 要求低。
这些优点使得自上而下方法更有效、更容易在广泛的实际计算机视觉应用中实现。本文主要对后者展开研究。
近年来,大部分自上而下的显著性检测方法中,几乎是根据颜色对比、纹理、形状等特征来实现检测,检测效果较好,能够突出显著性区域。
Achanta 和Hemami 等[14]提出了一种基于频率调整的显著区域检测方法,该方法通过从原始图像中保留更多的空间频率内容,输出具有明确显著对象边界的全分辨率显著图。Wei and Wen 等[15]从不同的角度提取背景信息,利用自然图像中两种常见的背景先验,即边界先验和连通性先验,为显著目标检测提供更多的线索。Lang 和Liu 等[16]提出了一种多任务稀疏追踪算法,该算法结合多种不同的特征用于图像显著性检测。根据一幅多视图特征描述的图像,通过对多视图特征矩阵进行联合低秩和稀疏分解, 寻找一致稀疏的元素来推断该图像的显著性映射。Shen 和Wu 等[17]提出了一种统一的显著性目标检测模型,将传统的低级别特征与更高级别的引导相结合,在一定的特征空间内将图像表示为低秩矩阵加稀疏噪声。
Xie 等人[18]结合拉普拉斯稀疏子空间聚类和统一低秩表示提出一种基于超像素聚类和统一低秩表示的显著性目标检测,该方法能较好的凸显连续的显著性区域。Huang 等人[19]充分利用背景信息,结合先验知识提出一种特征聚类的检测方法。
这些方法虽然效果较好,但是当检测到分布较广的显著性区域时,产生的区域连续性较不理想。针对此问题,本文利用背景的结构特征和统计信息,生成一个以背景信息为依据的初始显著图,该显著图