基于图像的数据增强方法发展现状综述

发布日期：2021年2月19日

预览
摘要

本内容试读结束

下载后可阅读完整内容，立即下载

现阶段，基于深度学习的图像处理和识别技术已经发展的十分成熟，但在某些图像识别任务中由于深度学习技术的特点，一些深度神经网络模型层数较多导致的学习能力较强，将图像数据样本中的特征学习的过于充分，使得神经网络模型在训练数据上出现过拟合现象。同时，基于深度学习的图像处理算法训练的模型的好坏与数据集的质量、规模息息相关，但由于客观原因存在获得的图像数据集小、图像质量差，样本分布不均衡等现象。针对上述问题，研究人员提出通过使用图像数据增强技术实现对模型的输入数据的规模、质量和分布情况进行优化，将数据增强后的数据集用于深度学习模型将有效降低出现过拟合现象的概率。本文的主要工作是对现有的图像数据增强技术进行讨论，从传统图像处理方法和基于深度学习数据增强方法两方面进行梳理总结，其中传统图像处理方法有几何变换、颜色变换和像素变换；基于机器学习的图像数据增强方法有自动数据增强方法、基于生成对抗网络数据增强方法和基于自动编码器和生成对抗网络组合的数据增强方法。本文着重对图像融合、信息删除以及基于生成对抗网络的图像数据增强方法等技术进行介绍，并且对文中提出的数据增强方法的思想及其优缺点进行讨论，为研究人员在不同图像任务中利用对应的数据增强方法来优化数据集从而提高模型准确率提供研究思路。

随着人工智能技术的不断发展，基于深度学习的图像处理技术愈发成熟，应用也越来越广泛。由数据集驱动的人工智能技术训练的模型往往需要巨大规模的数据集，但由于时间成本和金钱成本的限制，可能常会遇到图像数量少、图像质量差和类别不均衡[1]的情形，这给图像识别任务带来种种困难，数据集中图像的质量和数量极大的影响了深度学习模型的泛化能力。由于深度学习网络模型有着极强的学习能力，模型可能经常会将图像数据集上数据的一般特征提取出来作为预测某一类结果的特性，这往往会导致模型在训练集上会预测出很好的结果，而在测试集以及验证集上的有较高的错误率，模型的泛化能力低[2]。

基于图像的数据增强能够增加训练样本的多样性，如通过翻转、添加噪声等基础图像处理操作或根据现有数据生成新的样本进行数据集扩充、数据质量的增强。使用数据增强方法后的数据集训练模型，以达到提升模型的稳健性、泛化能力的效果。

本文主要研究了基于图像的数据增强技术，并对其进行归类整理，着重介绍各类技术的特点及其解