在农产品分拣过程中,果蔬的分类大多还停留在传统的分类模式,由人工进行果蔬筛选,这不但增加了
随着社会信息化程度的提升和AI 技术的广泛普及,人们对美好生活的向往迫切要求社会向智能化、便捷化发展[1]。计算机视觉技术在人民生活的各方各面起着越来越重要的作用,果蔬识别技术作为其中的一环,与商品零售、智能农业、智慧医疗等方向密切联系,既可有效减少劳动力开销,又能使人民在享受便捷精致生活服务的同时得到膳食引导[2],其广泛需求推动着相关领域的发展。
果蔬识别技术凭借其高效便捷的特性广泛应用于智能农业和产品分拣中。卡内基梅隆大学机器人学院科学家已提出建立农业机器人队伍来实现对农作物生产的辅助管理, 通过AI 技术判断农作物的成熟度等特性[3];比利时已通过视觉识别技术识别成熟果蔬并采摘,对未成熟果蔬的成熟时间给以预测[4];中国部分地区在茶叶采摘过程中利用视觉技术识别茶树嫩芽并实现定位及采摘以保证叶片完整性。
本文以果蔬识别为中心,探索智能分类功能的实现与应用,并结合基于深度学习的计算机视觉技术与传统互联网技术进行项目应用与展示,完成一个较为完善的果蔬识别系统。
2. 数据集 论文研究中通过数据增强技术取得2500 张源自自行拍摄的果蔬图像作为主要训练集,16854 张源自Kaggle 平台Fruits360 dataset 中的果蔬图像作为辅助训练集。
考虑到图像像素大小对识别的准确率会产生一定的影响,需要选择较为合适的像素大小对图像进行输入来达到提高准确率的目的[5]。由于所用计算机性能一般,为提升训练速度并使后期调用模型能够有较快的速度,选用像素大小分别为299 × 299、300 × 300、400 × 400、500 × 500、600 × 600、700 × 700的图像数据集测试图像像素大小对识别准确率的影响, 验证结果如图1 所示, 对比分析选择大小为400 × 400 像素的图像数据集作为开发数据集。
3. 图像识别 如图2 所示[6], 图像识别我们采用了常规卷积模型和Inception v3 模型。
在常规卷积模型构建上选用辅助训练集进行训练,包含三类不同品种苹果、黄桃、樱桃、荔枝、山竹、橘子、梨、火龙果共10 类果蔬图像共16854 张图像, 其中80%作为训练集, 20%作为测试集。
由于数据量较多, 训练所需时间较长, 考虑到计算机性能、时间因素等多方面原因,论文采用的网络较为简单,使用综合性能较好的