基于实例的多视角多标签学习算法

发布日期：2022年4月6日

预览
摘要

本内容试读结束

下载后可阅读完整内容，立即下载

在多视角多标签学习中，一个实例可以由多个数据视角表示，并与多个类标签相关联。目前现有的多视角多标签学习算法研究的是变量与类标签之间的关系。在这篇文章中，我们提出了一种基于实例的多视角多标签学习算法。与现有的多视角多标签算法不同，我们利用训练实例和测试实例的相关性进行建模。在多视角多标签学习中，数据来自多个视角。在每个视角中，通过构建偏最小二乘回归模型来探索训练实例和测试实例之间的相关性，而不是像传统的多视角多标签学习算法一样探索变量和类标签之间的映射函数。因此，我们可以从多视角数据中学习到多个偏最小二乘回归模型。此外，为了保证不同视角的一致性，在多个回归模型中加入视角一致性约束。对比实验表明，与现有的多视角多标签算法相比，所提算法获得了更好的分类结果。

在多标签学习中，每个对象都与多个类标签相关联。这些类标签是相关的，每个类标签通常与其他类标签相互依赖。多标签学习的目标是基于类标签的相关性构建一个分类模型[1]。近几年，多标签学习在很多场景中得到了广泛的应用，例如图像分类[2]，文本识别[3]，情绪分类[4]和社交网络挖掘[5]。

然而，在多标签学习中仍然存在两个开放性的挑战：1) 如何利用相关性有效地建立模型；2) 如何有效地处理多标签数据的高维问题。目前，已经有许多算法被提出用来解决第一个挑战[6] [7] [8] [9] [10]，然而这些算法的复杂度相对较高[11]。对于第二个挑战，有两种解决方案：特征选择和降维。但是特征选择忽略了标签之间的相关性，传统降维的结果可解释性也很差。

为了解决这些问题，Liu 等人提出了一种基于实例的稀疏的加权多标签学习算法SWIM [12]。SWIM 采用偏最小二乘(PLS)回归来研究训练集实例和测试集实例的相关性。SWIM 将实例映射到一个潜在空间中，可以更有效地降维，从而解决高维问题[13]。实验结果已经证明SWIM 的分类效果明显高于对比的其他多标签学习算法。

尽管SWIM 有更好的性能，但是它是用于解决单视角多标签学习问题的，不能直接用在多视角多标签学习数据上。而在现实中，可以从多个不同的方面来描述一个对象。例如，在web 图像检索中，一个实例可以用两个特征集来描述：图像的视觉特征以及用于描述图像的文字特征。另外，在图像分类中，我们可以用多个不同的特征集合来描述一幅图像，例如RGB，SIFT 和GIST [14]。在这些应用中，一个对象与多个特征集合(即多个视角)相关联，并且每个视角表示了同一对象的不同方面。

因此，一个视角可能包含了其他视角所没有的一些独特的分类信息[15] [16]。

这表示，相较于在每个视图中分别训练单独的分类器，利用不同视角的一致性和互补的信息来建立模型会拥有更好的性能[17] [18]。

SWIM 在每个数据视角中单独学习对应的多标签分类器，所以只能用于解决单视角多标签学习。它不能利用不同视角的一致性和互补信息来提高分类器的性能。

综上所述，我们提出了一种包含了多个视角的一致性和互补信息的模型，用来提高多标签分类器的性能。具体而言，考虑到每个对象都用多个视角表示，我们采用PLS 回归算法将多视角实例映射到多个