领域自适应是解决跨域识别的有效方法,它是迁移学习在计算机视觉方面的有效应用,将源域学到的知识迁移到目标域的识别任务中,有效解决目标域标注数据不足的问题。本文提出了一种新的基于交叉重构的领域自适应方法(Cross Reconstruction-based Domain Adaptation, CRDA),通过对原始源域和目标域的交叉重构来构造新的源域与目标域,使得同类数据相互交织,缩短同类数据间的距离。并通过对重构矩阵施加低秩约束,将两个域的同类数据对齐,以此来充分挖掘源域和目标域同类数据之间的内在结构信息,并利用该结构信息来学习分类器,从而取得更好的跨域识别效果。在五个公开数据集上的实验结果表明CRDA有着较高的跨域识别准确率。
随着在线自媒体和短视频的快速发展, 对图像和其他多媒体数据的自动识别和分析的需求越来越大。
然而,由于科技的飞速发展,很多领域却没有足量的有效标注数据,而通过人为进行数据的标注是十分昂贵并且耗费时间的,这导致了传统机器学习的局限性。因此,利用现有领域中充足的有标注数据来促进相关目标领域的模型学习的迁移学习方法是更经济、高效的方法。领域自适应是迁移学习在计算机视觉中对图片进行跨域识别的一种十分有效的方法[1] [2]。
2. 相关工作 在这一节中, 将介绍和本文相关的工作, 潜在的低秩表征方法(Latent low-rank representation, LatLRR) [3],并且会详细介绍数据的交叉重构方法。
2.1. 潜在低秩表征 潜在低秩表征(Latent low-rank representation, LatLRR)是一种基于低秩表征的子空间学习方法,它能利用大量未观测样本来更好地表示原样本,它的原始目标函数如下: []*min. .
, ZOHZs t XXXZ= (1) 其中, OX 代表能够观察到的数据, HX 代表着不能被直接观察到的数据,通过贝叶斯引理[4],我们知道X 可以被表示为XXZCX=+,则LatLRR 的目标函数如下: *1, min. .
Z E ZCs t XXZCXλ+=+ (2) 其中, *⋅表示矩阵的核范数,它的值是矩阵所有奇异值之和, 1⋅表示矩阵的1l 范数,它的值为矩阵中的每个元素绝对值之和。Z 是低秩约束的重构矩阵,C 是投影矩阵,为了减少噪声的影响,LatLRR 中引入了噪声矩阵E,最终的目标函数如下: