生成对抗网络在计算机视觉领域的应用

发布日期：2018年11月20日

预览
摘要

本内容试读结束

下载后可阅读完整内容，立即下载

生成对抗网络(GAN, Generative Adversarial Networks)的出现是计算机视觉领域又一里程碑式的发展，它为解决各种图像预测问题提供了新型工具。以此为目的，本文通过相关文献的调研以及结合最新成果 *通讯作者。文章引用: 江春雨, 程琳, 黎晓明亮. 生成对抗网络在计算机视觉领域的应用[J]. 计算机科学与应用, 2018, 8(11): 1726-1733.

生成对抗网络最早是在2014 年由Open AI 的Ian Good fellow 等人提出的一种创新型模型[1]。

它的出现为解决工程和数学领域中高维度概率密度分布中采样和训练的问题提供了帮助。随后经过两年对生成对抗网络的研究与总结，Ian Good fellow 等人在2016 年神经信息处理系统进展大会上对生成对抗网络的相关知识体系进行了汇总[2]。生成对抗网络的理论在此基础上被证明了是一种具有非监督学习性质的收敛模型，这就为其在后续的应用中提供了可行性和实践性。它能够在不需要假设数据分布的前提下，来对一种随机分布进行直接采样，进而得到全局最优解。生成对抗网络的优点之一是它回避了一些比较复杂的概率运算，在训练过程中不涉及到最大似然估计和马尔科夫链等复杂算法[3]，又因为生成对抗网络善于捕捉模型的分布方式等一些独特的优点，其概念和模型被学术界广泛接受。至此以后以生成对抗网络作为研究基础的拓扑结构以指数爆炸的速度发展着，从GAN ZOO 中统计的自2014 年以来以生成对抗网络作为研究基础的论文数量的数据中可窥见一斑。

为此，针对生成对抗网络非监督学习这一特点，本文着重分析了非监督学习相较于监督学习的优势，对比了一些主流的无监督生成模型；主要总结了相对于标准生成对抗模型扩展模型——条件生成对抗网络(CGAN, Conditional Generative Adversarial Nets)、深度卷积生成对抗网络(DCGAN, Deep Convolution Generative Adversarial Nets)、循环生成对抗网络(Cycle GAN, Cycle Conditional Generative Adversarial Nets)做出概括的应用。生成对抗网络及其各种衍生模型的进一步研究必将有效解决计算机视觉问题，而且利用生成对抗网络来提升机器理解世界的能力，也必将成为人工智能中的重要研究方向。

2. 监督学习与无监督学习 2.1. 深度学习的研究实质伴随着Alpha Go 成为第一个击败人类职业围棋世界冠军的人工智能机器人开始，机器学习又走回了人们的视野。至此，机器学习在经历了数十年的跌宕起伏发展之后，又迎来了它的第二次浪潮——深度学习。如今，深度学习俨然成为了21 世纪计算机学科的热门研究方向之一。深度学习最重要也最广泛的应用是数据挖掘(Data Mining)，它是利用大数据的方法来学习样本特征，并对其多特征的特点进行分类或者预测[4]，从而找到一些解决复杂问题的途径并提高执行效率的方法。由此看来，深度学习的实质是通过构建具有很多隐层的深度学习模型和海量的训练数据，来习得更有用的特征，从而最终提升机器分类或预测的准确性。