动态环境下的局部避碰是自主地面车的一项基本功能,在自主导航中占有重要作用。由于遗传算法具有早熟收敛、局部最优解和占据较大的存储空间等缺陷,为了提高自主地面车的避碰能力,本文提出了一种基于学习分类器的自主地面车在狭隘环境中路径避碰规划方法,设计改进了特殊的遗传算子。不同环境的仿真实验结果表明LS-SVM和学习分类器结合用于自主地面车的路径规划是收敛的,提高了ALV在狭隘环境中快速发现安全路径的能力。
狭隘环境的路径避碰规划是地面自主车(Autonomous Land Vehicle, ALV)自主导航的关键技术之一, 是指在各种复杂的地面环境中,无需人工干预就可以自主完成各种工作[1] [2]。自主地面车ALV 最初由马丁·玛丽埃塔公司研制, 该车的主要部件有视觉系统、导航系统和装载平台。
由于ALV 工作环境复杂, 本文仅就导航方面[3] [4] [5] [6],对自主地面车在狭隘环境下的避碰能力进行了研究,主要解决ALV 在狭隘环境下的早熟收敛、局部最优解、占据存储空间较大、收敛数度慢等问题。
学习分类器[7] [8]是基于信用分配的强化学习机制和基于遗传算法(GA)的规则发现机制。
本文提出融合LCS 的衍生系统XCS 和LS-SVM 算法,通过对环境的学习和反馈来解决ALV 的路径避碰规划问题, 设计了在狭隘环境下的集成适应度函数, 改进设计了新的遗传算子。
仿真实验结果也表明XCS 和LS-SVM结合用于ALV 的路径避碰是高效的。
2. 相关技术原理 2.1. 学习分类器(Accuracy-Based Learning Classifier System, XCS) XCS [9]作为LCS 的衍生系统是由Wilson 提出的基于精度的学习分类器,集成了强化学习、遗传算法和覆盖算法。
XCS 是由条件、动作和预测回报三个主要的参数组成:条件指明XCS 可以匹配的环境输入状态;动作表示在该XCS 匹配的环境状态下XCS 的建议动作;预测回报P 表示该XCS 被匹配且执行了该XCS 所建议的动作后系统预期从环境获得的回报。
预测误差ε 表示预测回报P 的误差;适应强度P表示预测回报P 的精度。
2.1.1. 执行机制 初始分类器集合是随机生成的,每个分类器表示为状态、动作对。根据环境输入,产生一个匹配环境输入的匹配规则集,然后依据每个分类器的回报预测和适应强度值,生成整个系统的预测列表和动作集,最后依据分类器的动作概率选择一个作用于环境的动作。