基于ResNet-ViT和注意力机制的车道线检测方法

发布日期:2023年5月31日
基于ResNet-ViT和注意力机制的车道线检测方法 基于ResNet-ViT和注意力机制的车道线检测方法 基于ResNet-ViT和注意力机制的车道线检测方法

本内容试读结束

下载后可阅读完整内容,立即下载

基于ResNet-ViT和注意力机制的车道线检测方法

车道线检测是自动驾驶领域中的重要感知任务。针对当前基于卷积神经网络(CNN)的车道线检测方法存在网络推理速度慢和对细长车道线结构建模能力不佳的问题,提出了一种基于ResNet-ViT和注意力机制的车道线检测方法。具体地,该方法首先搭建主干网络ResNet用于特征提取,并在主干网络中引入Vision Transformer (ViT)的编码结构,以提高网络对车道线细长结构的建模能力。其次,设计辅助分割网络,在其中嵌入通道注意力机制模块,以增强网络对重要通道的学习能力;辅助分割网络与主干网络通过共享部分参数来实现权重共享,从而提高模型的效率和泛化能力。最后,特征解码部分引入行锚分类的思想,在特征图行方向上预测车道线的位置坐标,输出带有车道线标记点的图像。经过实验验证,本文所提出的方法在TuSimple数据集上的准确率达到96.04%,推理速度达到98帧/秒,验证了其有效性。

随着自动驾驶技术的蓬勃发展,车道线检测已经被广泛应用于车辆辅助驾驶及自动驾驶环境感知模块中。快速且准确的进行车道线检测是保障车辆安全行驶的前提。在当前的研究中,视觉传感器被广泛采用来检测车道线,主要是因为在道路图像中,车道线的视觉特征较为明显,并且相较于GPS 和激光雷达,视觉传感器具有价格低、鲁棒性好等优势。然而,车道线在实际路况中的形状、颜色呈现多样性, 并且车辆行人的遮挡、车道线使用时间过长出现的磨损、天气因素等等都会影响车道线的连续性。

因此, 如何提高车道线检测的准确性和实时性是自动驾驶领域亟待解决的问题。为了解决这些问题,我们需要研究如何处理车道线的多样性,并且探索如何在保障实时性的前提下提高车道线检测的精确度。

目前,车道线检测可分为基于传统图像处理的方法和基于深度学习的方法。传统图像处理方法大多是基于人工特征提取,并采用直曲线模型来拟合车道线。Chao Ma 等人[1]提出了一种基于CIELab 颜色特征聚类的车道线检测算法,该算法通过颜色聚类识别车道线,依据道路的几何特征,采用二次曲线来匹配车道。段建民等人[2]提出了一种改进的顺序随机抽样一致性(RANSAC)的车道线检测算法,采用改进简单图像统计(SIS)阈值算法对图像进行二值化处理, 构建车道线模型后利用改进的顺序RANSAC 算法拟合车道线,最后进行模型配对确定车道线。吴彦文等人[3]提出了一种基于视觉传感器与高精度地图相融合的车道线检测与跟踪方法,首先采用改进的霍夫变换提取边缘线段,其次根据滤波预测更新车道线模型状态参数,最后结合高精度地图中车道线先验模型参数跟踪车道线轨迹。虽然这些方法取得了一定的成果,但存在过度依赖人工提取的特征、检测精度低、环境适应性差等问题。为了克服这些问题,具有强大建模能力和特征学习能力的深度学习方法成为国内外学者研究的重点内容。在深度学习方法中, Kim 等人[4]提出了一种基于CNN 的车道线检测算法,利用CNN 提取图像中的特征信息,采用聚类等后



相关标签