基于卷积神经网络的宠物识别

发布日期:2019年6月18日
基于卷积神经网络的宠物识别 基于卷积神经网络的宠物识别

本内容试读结束

下载后可阅读完整内容,立即下载

宠物在人们的生活当中,已经变成了人们日常生活不可分割的一部分,越来越多的人会去饲养宠物,伴随着人们智能化的不断提升,智能家居的全面发展,也对于宠物的管理提出了更高的要求,所以对于宠物识别技术的研究也有着很高的实际意义。该文提出一种基于神经网络的实时宠物识别,技术路线,使用Opencv,Pycharm,Python,采用神经网络的宠物面部监测和分类功能。对实时采集到的宠物图片

智能门禁系统已经被证明是智慧城市建设不可或缺的一部分,对于物体的识别技术在门禁系统中又扮演着极其重要的角色,例如:智能停车场系统中的车牌识别技术应用,火车站出入口人脸识别检测技术,并且已经在社区管理、学校考勤、科技园区等领域得到广泛的应用[1]。我们将其应用在对于宠物的智能管理上,提高对于宠物的管理效能。我们通过使用Opencv 软件,对视频流进行截取,对截取图片当中的宠物,使用MobileNet-SSD 神经网络进行对于宠物的识别,训练集采用Kaggle 开源的猫狗数据集, 大大提高了识别的准确率。

2. 宠物识别过程 2.1. 视频流截取宠物图片 对于动态视频流数据处理可以转化为静态图像帧的处理,这样就可以在不改变图像模型的情况下实现对视频流的处理工作[2]。这里我们用到opencv,使用Python 语言开发具有高效性, 得益于其丰富的第三方库,Python 能够将其他语言制作的模块快速轻松地连接在一起。本文所使用的OpenCV 就是可以通过Python 语言进行调用的一个第三方视觉库。Open CV 于1999 年由Intel 创立至今经过多年的发展已经成为当今计算机视觉领域一款功能强大且通用的图像视觉处理库。

使用opencv 自带的videocapture()函数定义摄像头对象,本实验调用的是笔记本的内置摄像头,在while 循环中,利用摄像头对象read()函数读取视频的每一帧。截取图像过程如图1 所示: Figure 1. Interception process 图1. 截取图像过程 截取图片结果如图2 所示。

2.2. MobileNet-SSD 神经网络 Mobilenet 主要是为了适用于移动端而提出的一种轻量级深度网络模型[3]。

主要使用了深度可分离卷积将表捉卷积核进行分解计算,引入了两个超参数去减少计算量,这两个超参数是宽度乘数和分辨率乘数。

深度可分离卷积是将一个标准的卷积核分成深度卷积核和1*1 的点卷积核, 假设输入为M 个通道的featuremap, 卷积核大小为Dk*Dk, 输出通道为N, 那么标准卷积核即为M*DK*DK*N。

例如, 输入feature map 为m*n*16,想输出32 通道,那么卷积核应为16*3*3*32,则可以分解为深度卷积:16*3*3 得到的



相关标签