分类可视化能够直观表达体数据的结构特征,是研究体数据的重要方法。本文提出一种基于概率分类模 *通讯作者。
体数据主要由不同传感器在三维物理空间采样或科学计算等方式获取,因此在不同的应用领域,体数据可能表示为标量场,如温度、压强等,也可能表示为矢量场,如飓风数据、磁场数据等。对原始数据的直接研究缺乏直观性和启发性,而分类可视化通过对不同结构、特征的分类,能够更好地暴露体数据的分布规律,帮助研究者挖掘数据中蕴含的信息,增强可视化结果的表达能力,对体数据的研究具有重要意义。
分类可视化方法主要分为三类:基于传递函数的方法、基于统计的方法和基于标记的方法。在基于传递函数的方法中,Tian 等利用交互的传递函数进行海洋涡流的可视化[1],通过修改传递函数来提取二维、三维的涡流特征。Ma 等提出了一种基于聚类和特征可见性度量的传递函数交互设计算法[2]。Lan 等将空间连接计算整合进基于二维传递函数的体数据分类中[3],获得了较好的结构分离效果。Kawamura等设计了一种面向多变量的多维传递函数生成方法[4],该方法不但能够实现多变量的体数据可视化,还可以兼容面绘制等传统绘制技术。基于传递函数的体数据分类方法仅仅从可视化映射阶段实现了体数据的分类,对于结构化体数据,特别是均匀网格体数据能够得到良好的结果,但当面向空间分布不均匀的非结构化体数据时,会产生诸多绘制失真和错误,并且该类方法不能实现体素的分类。基于统计的体数据分类方法的理论基础为决策理论和概率模型,能够实现体素的分类,被大量应用于数据预分类和离线分类算法。
McGivney 等通过贝叶斯框架提出一种解决部分容积效应的方法, 该方法通过采用迭代算法计算后验概率密度的最大后验估计,得到体素的主要成分,实现体素的分类[5]。Prilepov 等利用体素的混合模型进行二元决策边界的提取,实现混合物质边界的重构和表示[6]。基于标记的体数据分类方法通过在空间上限制传递函数对体数据的作用,减小了传统方法容易引起的绘制结果失真,可以实现光滑、二元的边界决策。Liang 等设计了一种基于标记的交互体绘制方法[7],用户选择感兴趣的区域后,算法将重新调整传递函数并优化感兴趣区域的绘制质量。然而该类方法没有考虑到边界周围的信号退化问题, 因此在面对含有大量不确定性的体数据时,基于标记的体数据分类方法反而会产生更多的失真和错误分类的情况。
本文提出一种基于概率分类模型的体数据分类可视化方法,通过核回归将体素概率分类模型引入体数据重构,然后基于构造的重构有效性,实现重构点的可视化映射,采用光线投射法获得体数据的分类可视化结果。