近年来,隐式神经三维建模算法是计算机视觉领域的热门研究方向,特别是基于符号距离函数(SDF)的方法,然而目前的模型往往泛化性不强。由此问题,该文利用动态图卷积网络对点云进行形状编码,引入了形状先验假设,提出了一种结合物体个性特征和其所属类别共性信息相结合的隐式三维建模算法,提升了模型的准确性与泛化性。在ShapeNetV2数据集上,相较于现有算法取得了更好的效果,表明了本方法在三维隐式建模问题上的优越性。
点云,作为一种三维显示表征方式,相较于体素以及网格而言,是一种轻量化的结构,但是损失了拓扑结构的信息,观察起来并不直观,为此,有许多传统算法实现了从点云到表面网格的转化,目前, 也有越来越多的深度学习算法来完成该任务,并且大多数任务最终模型的输出并不是直接的表面,而是依靠符号距离函数,隐式的生成三维模型。特别地,基于神经辐射场的三维重建算法近几年相当火热, 其依靠多视图以及相机位姿的输入,生成相应的光线,并在光线上采样点的方式,本质仍然是基于点的方式隐式生成表面。
在基于深度学习的算法中,大多算法忽略了模型的泛化性,它在未知的形状上的表现不佳。这是因为,他们忽略了形状之间的联系,对于属于同一种类的形状而言,基本上其集合结构应该是相似的,特别是对于室内物体而言,它们都是人造的,人类也是基于经验制造的该类结构性的物体以满足相应的功能。
为此, 本文提出了一种形状的假设, 该假设结合了同一类别物体的共性信息和其中实例的个性特征, 使得同一类别的实例的拓扑结构之间产生了联系,并在该假设下,建立了相应的模型,该模型采用流行的隐式表面重建的思路,通过该模型可以学习空间中任意一点(在边界内)的SDF 值,并理论上可以完成任意精度的高质量三维表面重建。
我们在ShapeNetV2 数据集上进行了相关三组类别的实验, 并验证了形状假设的可行性和效果。
2. 相关工作 2.1. 隐式表面重建 基于三维隐式表示的深度学习算法在近几年层出不穷, 隐式表示的表征能力相较于显示方法更好, 这是因为隐式表征理论上可以显示任意精度的三维模型,而显式方法受存储的限制而扩展精度。[1]提出了IM-NET的自编码器, 需要点坐标和形状的特征向量的输入, 采用解码器和对抗生成后输出该点的占有率。
[2]提出了一种基于多视图和体渲染的方以彩色图作为监督学习三维模型,其中[3]建立了SDF 值与体渲染之间的联系可提取出高质量的表面提取网络。上述方法都是基于2D 进行三维隐式曲面估计的方法,但本质上仍然是基于点的方式。此外,还有一类直接的方法,[4]直接使用多层感知机预测每个点的SDF 值, 并提出了一种自解码器的架构, 使得其具有了表示一类形状的能力。
[5]提出了一种表面生成框架AtlasNet, 它将3D 形状表示为参数表面元素的集合,直接地推断出形状的表面表示。[6]提出了一类基于占有率的网络Occupancy Network,并引入了多分辨率等值面提取算法,以更好地提取表面。[7]提出了局部隐式网格表示,具有可扩展性和通用性,训练一个自动编码器来学习在该尺寸下嵌入3D 形状的局部组件。