基于光流的运动图像分析是解决目标跟踪、视频压缩等许多机器视觉问题的关键技术之一。从光流场的含义和求解思路入手,对运动图像分析问题和现有研究工作进行了较为全面的描述和分析,最后展望了未来的研究方向,并推荐一些比较好的网络资源。
运动图像分析(也称时变图像分析)的目标是确定空间物体的三维运动和结构, 是目标跟踪的基础, 其分析方法可以分为基于特征的方法和基于光流的方法。
从运动物体的图像序列中提取出正确的光流矢量,因为光流矢量构成的集合通常被称作“光流场”(optical flow) [1],主要涉及一个从某一图像序列中计算其可见点的三维速度矢量在成像表面上投影的过程,因而有些文献也称之为光流场计算或运动估计(motion estimation),是视频压缩、三维重建、运动目标检测、目标跟踪、活动检测和关键帧提取等许多机器视觉问题的关键技术之一。目前,光流场计算与分析在信息科学、军事科学、气象学、生物医学和实验流体力学等诸多学科领域的应用日益广泛深入, 而光流计算问题本身的研究越来越突显出其重要性,与时间差分法、背景建模法并列成为运动目标检测的三大主流方法。
2. 问题描述 为简化叙述,我们以一些“点”为例进行说明,如图1 所示。运动图像分析要解决这样一个问题:如何估计图1 中各像素点从图(a)到图(b)的运动?问题可以转化为像素匹配问题,即给定一个图1(a)中的像素点,找出图(b)中的对应点。于是就涉及到特征的选择和匹配问题,比如说做出一些关键性的假设, 像颜色恒常性(即图(a)中的像素点和图(b)中的对应点颜色一致;对于灰度图像, 则表现为亮度一致性。
)、小距离运动(即图中的像素点不会移动很远)等等。
特征匹配问题在具体计算中被转化为特征场的计算, 具体来说就是视频序列中存在的图像时空信息, 包括亮度、颜色值、帧差分信息、纹理、边缘等。
光流是由图像中的运动目标形成的图像灰度/亮度模式的变化,光流场计算即根据上述时空信息从运动图像序列中计算图像目标运动的速度矢量集合[1],如图2 所示,其中图2(a)代表运动图像的视频;图2(b)为间隔一点时间对视频中的运动目标进行剪影形成的图像序列;图2(c)为检测出的“光流场”。
(a) (b) Figure 1. The motion analysis with the “point” as an example 图1. 以“点”为例的运动分析说明