在自然环境下,辣椒果实生长比较密集,目标检测算法很难区分被枝叶遮挡或被其他辣椒遮挡的情况,这对自动检测辣椒果实增加了困难,在本文中,我们采用现有的辣椒数据集,基于YOLOv5算法模型进行了辣椒图像识别。为了更好的对辣椒进行检测,减小因为枝叶遮挡和被其他辣椒遮挡而造成的检测难度,我们在原来的YOLOv5模型中加入了CBAM注意力机制,构建了CM-YOLO模型,我们的模型mAP可以达到93.1%,比原来的YOLOv5高0.4个百分点。我们所构建的CM-YOLO模型提高了对辣椒的检测能力,同样该模型也可以应用于农产品识别和分类等其他领域。
现如今, 人工智能技术已经渗透到我们的日常生活中, 其在农业采摘领域的应用也越来越广泛[1] [2]。
在采摘辣椒的行业中,传统的人工采摘效率低且成本高,因此,实现辣椒的自动采摘、保证辣椒果实的及时采摘、并降低采摘成本,已经成为该行业发展的必然趋势。对于实现自动采摘辣椒果实,辣椒信息的智能感知和定位技术是关键所在[3] [4]。因此,为了提高辣椒自动采摘效率,必须实现辣椒果实目标的快速、准确的识别和定位。
自然生长环境下辣椒通常会存在重叠遮挡现象,此类果实的识别是自动采摘辣椒的重要问题[5] [6]。
重叠遮挡生长状态下的辣椒果实识别方法不同于无遮挡形态果实以及其他生长状态下的果实,因此,能够自动识别有无重叠遮挡状态下的辣椒果实成为关键。
近年来,目标检测和定位技术发展迅速,在各个领域都有这些技术的参与,其中在农业领域也取得了显著的成果,这为辣椒果实地识别与定位提供了研究基础。目标检测算法可分为传统的检测算法和基于深度学习的算法。然而,传统目标检测算法在处理复杂多变的背景时,其检测效果容易受到较大的影响。因此,研究者们一直在不断改进这一方法。Whittaker 等[7]为了检测番茄,使用Sobel 算子检测果实的边缘,并利用Hough 变换计算番茄的中心坐标。该方法能够很好地识别重叠的番茄,但是处理时间较长,识别效率较低。Gongal 等[8]为了实现对苹果的自动化检测,结合了HSI 和RGB 颜色空间,对苹果图像进行了处理。利用Otsu 阈值分割和Hough 变换对苹果进行了分割识别,平均识别精度为78.9。该方法不适用于数量较多、环境较复杂的辣椒。随着深度学习卷积神经网络技术的不断发展,目标识别检测相较于传统方法展现出更高的优越性[9],目前的卷积神经网络主要分为两大类,一种是端到端的方法[10],主要有YOLO、SSD、RetinaNet,另一种是基于区域建议的方法[11] [12] [13],主要有Fast RCNN、Faster RCNN、Mask RCNN。
在本文中,为解决辣椒果实生长密集、在识别过程中可能会遇到漏检或错检的问题,构建了CM-YOLO 模型。
2. CM-YOLO 模型结构 2.1. YOLOv5 模型 YOLO [14] [15]系列网络模型是最为经典的one-stage 算法,在目标检测的网络里面,它是在工业领域使用最多的网络模型。YOLOv5 网络模型在继承了原有YOLO 网络模型优点的基础上,具有更优的检