基于树形结构编码器的点云补全算法

发布日期：2022年4月13日

预览
摘要

本内容试读结束

下载后可阅读完整内容，立即下载

点云补全是目前计算机三维视觉领域较为重要的一个方向，目前的深度学习算法采用的是编码器–解码器结构，常用的编码器难以提取出精细的局部特征。本文基于生成对抗网络，提出一种带有树形结构编码器的点云补全算法。树状卷积结构可以提取更为精细的点云特征向量，并提高算法的计算效率。最后利用特征金字塔模型来生成点云的缺失部分。实验结果表明，基于该网络结构补全的点云数据具有有效性，并且补全精度相对于PCN算法有一定精度提高。

三维视觉在实际生产生活中有着广泛的应用，相关技术也随着深度学习的发展得到了进一步的推进。

在各类3D 数据中，点云由于其数据量小，表现更完美，受到研究人员的热捧。现实世界中的点云数据通常由激光扫描仪、立体相机或低成本的RGB-D 扫描仪等传感器采集而成。

但在实际应用中由于采集设备性能和环境的限制，真实扫描到的点云数据通常会因为遮挡、视点不同和噪声干扰等问题，造成数据的不完整，限制了点云数据在深度学习领域中的运用。例如，在对点云数据进行分类的任务中，若点云数据不完整，则会极大地影响到最终的分类效果。在点云数据不完整的情况下，分类效果不理想。因此如何从不完整的点云数据将其重新补充为完整的点云数据成为一个实际应用中不可缺少的任务。现有的点云补全网络发展迅速，大多数用于形状补全的工作是以全监督的方式以部分–完成配对成训练数据对算法模型进行训练。虽然他们在域内数据上获得了很好的结果，但这些方法推广到域外数据以部分–完成配对成训练数据对算法模型进行训练具有挑战性。尽管他们在自己的数据集上表现很优异，但是推广到其它的数据时，模型的泛华能力就会大打折扣。

考虑到真实世界数据的复杂性，这些模型往往不能获得令人十分满意的结果，对局部细节的补全效果不够理想。

目前主流算法使用体素和距离字段来描述三维对象，以此完成三维形状补全任务。基于三维对象，使用三维卷积来进行完成点云补全和其他任务，并且在三维补全任务上取得了重大成功，像3D-ED-GAN和3D-RecGAN，虽然实现了三维数据的补全，但是使用三维卷积的方法受限于分辨率，随着分辨率的增加，内存负担和计算成本成指数增加，虽然基于稀疏矩阵的方法又缓解这一问题，但是对于细节信息丢失严重。不同于上述这些方法，非结构化的点云数据因为内存消耗小，对细节表示能力更强，所以现有的研究通常使用点云数据来表示三维对象。但是由于点云数据的无序性质和非结构化性质，它不适用于现有的卷积操作。Pointnet [1]通过直接处理点云数据，解决了点云的无序性和旋转性问题，这对点云的深度学习有着至关重要的影响，并且激发了大量研究的灵感。PCN [2]是第一个专注于点云补全任务的深度学习网络模型，它提出了编码器–解码器框架，编码器主要由PointNet++ [3]组成。Pointnet++将点云分解成多个块，使用PointNet 提取它们的特征向量，并将这些向量通过MLP 生成全局特征向量，提取到的全局特征向量考虑到了点云的局部特性。PCN 使用的解码器由FoldingNet [4]组成，可以生成详细的点云和粗略的点云。

由TopNet 提出一种新的解码器，可以通过在根树架构中隐式建模点云结构来生成结构