目前,目标检测算法的应用场景不易灵活变动,机器人在执行复杂问题时,面临较高的计算和存储资源的问题,以及机器人的可扩展性较低的问题。针对机器人进行目标检测方面的扩展,提出用基于RDK云服务机器人实现多场景式的目标检测,基于YOLOv5优化的目标检测算法对环境中的多种物体进行识别。云机器人服务的分布式部署可提高资源的利用率。通过编辑蓝图调用算法模型和基于Blender设计的动作,Smart Voice语音系统可以调用整个蓝图事件,完成数据采集、目标导航、物体识别、机器人运动等多种工作,达到实现基础服务功能的目标。
随着技术的进步,以及人类对智能服务机器人的要求越来越高,兼具高机动性能、智能化交互的机器人正在成为全球的研究焦点。并且现阶段新冠肺炎疫情防控压力犹存,减少公共场所人员接触是防止疫情扩散的有效手段,在这样的背景下,用机器人代替人工的需求被激发。
就目前而言,在机器人方面的研究如雨后春笋般涌现。但许多的研究方向都是基于具有极佳运动控制系统的仿生机器人,刘京运[1]所阐述的四足机器人进化史介绍了仿生机器人在运动控制方面的快速发展。在基于深度强化学习方面的机器人路径规划[2]和机器人运动控制[3]方面都有长足的发展。在大多数的服务机器人工作的环境下,极佳的运动控制系统和仿生机器人的优势都不能够得到十足的体现,在服务机器人领域,最为关注的问题还是资源的利用和人机交互的优化方面。而伴随着5G 技术的发展与突破, 通过云端建立云服务机器人系统是提升机器人计算和存储资源的重要途径。
基于SOA 的云服务机器人框架设计[4]主要针对于资源共享负载均衡进行了阐述,具体针对与机器人的运转并未过多介绍。也有部分针对于机器人操作和目标检测相结合的研究,例如结合目标检测和机器人抓取实现番茄的采摘[5]、水面垃圾的清理[6]以及针对识别算法进行优化,提升机器人的抓取成功率[7],但大都是在针对于固定任务场景下的对单项任务的完成或是抓取的运动策略方面的优化。鲜有涉及到云机器人交互设计、多场景任务模式等方面的研究。
虽然目标检测已应用在各个广泛领域, 但是云服务机器人并未得到广泛的应用, 目前,在基于云端机器人系统向目标检测应用方向扩展的研究较少。
因此,为解决多适应场景下的基于云服务机器人的目标检测算法的实现问题。本文以智能服务机器人在仿真咖啡厅场景下的多种交互操作任务为基础, 将YOLOv5 目标检测算法结合机器人自然语音理解、导航行走、物品交互等多模态技术。通过达闼科技[8]的HARIX 海睿云端大脑完成对云服务机器人的控制,让目标检测算法能够上传至云端,并在机器人上得到调用实现,达到实现多应用场景下目标检测的实现,能够完成识别并触发空调和灯的控制开关、冲泡咖啡、倒水等多种应用场景下的任务实现。
2. 总体设计 结合功能需求, 本作品需要以下6 个方面的支持, 分别是RDK 蓝图设计、数据采集和处理、YOLOv5算法训练、算法镜像部署、Blender 动作设计、Smart Voice 智慧语音。技术方案主要是采用YOLOv5 算法训练识别模型, 使用docker 将模型封装为镜像上传至云端, 进行RDK 蓝图编程调用云端部署的算法, 使用语音驱动意图进行识别,使用Blender 动作进行位姿的调整,完成各项任务。在整个实现的过程中, 研究方法主要包括理论研究、仿真实验、对比分析、验证优化等方法,在对机器人本身进行操作的过程中,需要通过不断地仿真实验和对比分析进行调整参数的设置,例如在蓝图的设计中要所有的蓝图节点能够按顺序准确运行, 每个节点函数的调用都要合理合规, 在动作设计中, 要求对位姿能有精准的调整, 对抓握等动作要有准确的设计, 以求达到最佳的使用效果。
在对算法的训练中, 要不断地进行验证优化,