基于截断核范数张量鲁棒主成分分析

发布日期:2020年3月25日
基于截断核范数张量鲁棒主成分分析 基于截断核范数张量鲁棒主成分分析

本内容试读结束

下载后可阅读完整内容,立即下载

低管秩张量的分解由于其在图像处理中的实际应用已经在各个领域引起了关注。但是传统的张量分解算

随着时代的发展和大数据时代的来临,从高维数据中发现和挖掘低维结构的思想已经在图像分析, 视频降噪,模式识别,基因数据分析[1] [2] [3] [4]等方面起着越来越重要的作用。一般来讲,假设我们给定一个被观测到的数据矩阵12nn×∈D,该矩阵是由另一个低秩矩阵12nn×∈L的其中一些元素被噪声污染后得到的。

为了从观测矩阵D 中恢复出L, 我们希望D 可以被分解为00=+DLS , 其中0L 是低秩矩阵, 而0S 中由于只有很少一部分元素才是非零的,所以我们称0S 为稀疏矩阵(这些非零元素即为异常值)。为了解决这个问题,文献[5]提出了用鲁棒主成分分析(Robust Principal Component Analysis, RPCA)方法来从被污染的矩阵D 中恢复出L: , 1mins.t.

.

L S λ∗++=SLLSD (1) RPCA 在多项式时间内仍然保持良好的恢复效果和稳定性,所以该方法被广泛地应用于数据分析工作中。遗憾的是,在大部分情况下RPCA 只能处理矩阵数据,即二维数组。然而高维数据(即张量)在实际生活和科研工作中随处可见,比如彩色图片,高光谱图像大部分都被编译为三阶张量:行,列元素的分布以及每一个像素的颜色;彩色视频也可以视为四阶张量。张量在图像去噪[6],视频存储[7],数据挖掘[8],背景提取[9]中都有着非常广泛的应用。而对于张量形式的分解,具体来说,就是给定一个三阶张量123nnn××∈,它可以被分解和被表示为=+,其中和在123nnn××的空间内分别具有低秩和稀疏的结构。

值得注意的是,关于张量秩的定义并不是唯一的,其中使用比较广泛的两种张量秩是由CANDECOMP/PARAFAC (CP) [10]分解和Tucker [11]分解得到的CP 秩和Tucker 秩。但上述两种秩的定义都有其局限性:文献[12]已经证明正确地估计CP 秩是一个NP-hard 的问题, 而Tucker 秩是一个向量而非标量,不适合用于比较大小。在本文中,我们采取基于张量SVD 分解的管秩(tensor tubal rank,见定义7)作为张量秩的定义。因此张量形式下低秩和稀疏部分可以通过下面的张量鲁棒主成分分析(Tensor Robust Principal Component analysis, TRPCA)问题求得 1, mins.t.

, λ∗++= (2) 其中1⋅和∗⋅分别代表1范数以及核范数(会在第二节定义);λ 为正则化参数,用于平衡低秩项和稀疏 项。图1 展示矩阵和张量分解的联系与区别。



相关标签