当今图片分类课题应用广泛,各种神经网络模型层出不穷。计算机性能和图片样本量对模型的训练和预测结果均有影响。针对于图片分类可能遇到的小样本问题,本文提出使用高斯过程分类模型和HSV图片分解的组合方式,与传统机器学习模型和RGB分解方式进行比较,发现该组合方式的准确率最高,效果最好。
深度学习因提取特征能力强,识别精度高,实时性快等优点被广泛应用[1]。科研工作者开始将深度学习应用到图像识别中,并且在最近的几年中取得了巨大的进步,图像的识别效率及识别效果比传统的识别手段有了巨大的进步。最近几年在人工神经网络的大发展背景下,基于卷积神经网络[2] (Convolutional Neural Network, CNN)的图像分类技术在智能数据采集和高效处理中也取得了较好的效果[3]。以CNN 模型为基础,将多层卷积和多层池化结合产生新的网络模型,可提高网络结构的准确度[4]。经典的卷积神经网络模型有LeNet-5 [5]、Alex Net [6]、Google Net [7]、VGGNet [8]、ResNet [9]、MobileNet [10]以及DenseNet 等。
很多网络的出现是对已有网络的排列组合, 加深了层次或者加多了节点数目。
近年来现有文献中基于小样本学习的图像分类算法都是采用深度学习[11]。
将深度学习中的技术用于小样本学习中,比如使用数据增强技术来增加样本的数量。迁移学习、元学习、对偶学习、贝叶斯学习以及图神经网络方法也被用于小样本图像分类的任务。然而,深度神经网络的训练质量受训练集中有标记样本数目的强烈影响[12]。在实际的问题中,数据获取往往是困难的,这之中既有个人隐私的问题,比如人脸数据,也有问题对象本身就很少的问题,比如识别珍稀保护动物的问题[13]。其次是算力问题,深度学习方法在提高算法性能的同时,往往伴随着庞大的网络运算,这也就使得深度学习的方法很难部署在计算资源受限的设备上。那么此时如何用小样本的图像数据进行分类、同时节省算力,达到很好的分类效果便成了研究问题的重点。
机器学习中的机器视觉利用机器模拟人脑,通过设备获取图像,然后经过一定的处理和特征提取, 最后识别出相关信息[14]。机器学习的核心是分类器的训练[15]。通过不断的训练和调整,最终得到一个适用的分类器模型,实现对事物的准确识别[16]。
高斯过程观测变量空间是连续域,时间或空间。高斯过程观测变量空间是实数域的时候,我们就可以进行回归而实现预测, 即高斯过程回归(Gaussian Process Regression, GPR) [17]。
高斯过程观测变量空间是整数域的时候(观测点是离散的),我们就可以进行分类,即高斯过程分类(Gaussian Process Classification, GPC)。由于模型特性,高斯过程在小样本数据集上效果很好。于是我们便可以将高斯过程分类这一方法,应用于小样本的图像分类中,避免了深度学习模型的庞大架构和数据需求,也能达到不俗的分类效果。
本论文从图片分解方式出发,结合分类算法研究了小样本图像识别工作。主要内容包括:本文的内容结构安排如下,首先在第2 节介绍高斯过程回归和高斯过程分类模型,然后在第3 节介绍图片的分解方式和原理,在第4 节给出了不同情况下小样本的图片分类的实验结论。最后在第5 节给出结论。