用于人脸表情识别的卷积神经网络研究

发布日期:2020年10月28日
用于人脸表情识别的卷积神经网络研究 用于人脸表情识别的卷积神经网络研究 用于人脸表情识别的卷积神经网络研究

本内容试读结束

下载后可阅读完整内容,立即下载

用于人脸表情识别的卷积神经网络研究

为了研究卷积神经网络在人脸表情识别中的应用,设计了一种10层的卷积神经网络模型识别人脸表情,最后一层用Softmax函数将表情的分类结果输出。首先,研究了卷积神经网络的卷积和池化算法并设计了模型的结构。其次,为了更形象地展示卷积层提取的特征,把提取的特征做了可视化处理并以特征图的形式展示。本文的卷积神经网络模型在Fer-2013数据集上进行了实验,实验结果展示了识别率的优越性。为了验证模型识别的泛化能力,最后自制了一个自然状态下的人脸表情数据集,并对人脸图片做了裁剪,灰度化以及像素调整等一系列的预处理。用本文模型识别该数据集中的人脸表情图片,识别的准确率达85.1010%。

随着人工智能的发展,人机交互被广泛研究。根据人类的表情让机器去学习人类的情感是人机交互的一个重要研究部分。人脸表情识别从广义上来讲是一个交叉学科,它的研究涉及计算机视觉,图形图像处理以及心理学等。研究人脸表情识别能够促进更好的人机交互,也是人机交互中一个不可或缺的部分。

研究人脸表情识别的目的:1) 在人机交互中更好地理解人类的情感, 从而提升人机交互的体验;2) 在视频片段中可以对人脸表情进行跟踪和识别;3) 研究人脸表情的编码模式,从而更有利于传输以及存储有人脸表情的图片。人脸表情识别在安防,心理学,医疗,客户满意度分析以及网络教学等领域有着广阔的应用前景。

从上世纪70 年代开始研究人类面部表情,并对人类的表情进行了分类。在传统的表情识别系统中, 把这一过程分为了特征提取和表情分类。提取脸部特征的方法有Gabor 滤波器[1];方向直方图HOG;离散余弦变换(DCT)和尺度不变特征变换(SIFT)等,然后利用SVM [2]或者PCA [3]对表情进行分类。随着深度学习的发展,深度学习被应用在了表情识别中。深度神经网络模型能够同时提取图像特征和图像分类,因此也为表情识别带来了极大的便利。

在计算机视觉中,卷积神经网络由于自身的卷积与池化操作,因此在处理图形图像中比其他的神经网络有更好的性能。本文设计了一种新颖的卷积神经网络结构进行表情特征的提取与分类。本文的模型借鉴了VGG 网络的思想,设计了一个卷积网络结构,并对网络结构的参数进行了调整。我们受到GoogLeNet [4]网络的启发在卷积神经网络的第一层添加了一个1 * 1 的卷积核来增加输入的非线性表示。

最后在全连接层我们通过丢弃一部分神经元,来简化了模型的复杂性。

本文的贡献:1) 借鉴VGG 网络思想设计了一种新的卷积神经网络结构。

2) 通过Fer-2013 数据集训练模型并验证模型识别的准确率。3) 自制了一个在自然状态下人脸表情数据集,并根据自制的数据集验证模型的识别泛化能力。



相关标签