本文根据多个一体化数据存储模型,结合多数据中心、分布式异构环境等实际需求,提出了基于要素类的多数据中心数据一体化存储模型,并以国家自然资源和地理信息基础信息库项目为基础,进行了建模。建模结果显示:该模型可以满足多数据中心、分布式异构环境下的海量多源数据一体化存储与管理。
国家自然资源和地理信息基础信息库是国家发改委联合11 个相关部门开展的建设项目, 旨在整合资源,切实提高资源的开发利用和共享水平,为社会提供标准化、规模化和可持续开发利用的自然资源和地理空间基础信息。
由于11 个部门的数据本身自成体系,汇集在一起形成服务时,在数据来源、种类、时间序列上均相比单个部门复杂。如何根据多数据中心、分布式异构环境下的应用需求,确立数据(矢量、影像、格网、图表、图片、文档等)的存储模型,形成各类数据的存储模型及实现技术方案是本文研究的重点。
2. 一体化数据模型研究现状 关于一体化数据模型的研究,有如下几种情况: 1) 提出一种新的空间数据组织模型——矢量栅格混合的数据模型[1]。从数据结构模型层次考虑[2], 能兼顾矢量、栅格数据模型的优点,矢量、栅格数据可转化到新模型中存储,从物理层次实现一体化。
2) 基于某一种软件技术对矢量、栅格、表格等数据的统一管理,物理上各种类型的数据选择软件提供的相应的物理结构存储,例如应用ArcSDE 这一成熟的海量空间数据库引擎,结合数据库管理系统能实现一体化的管理;或者基于OracleSpatial 实现了在Oracle 数据库中同时存储和管理栅格文件与矢量文件并无须借助其他工具[3]。
3) 从数据的组织管理考虑的,以某些软件技术为支撑,对分布式的多源海量的矢量、栅格、表格等数据的统一管理,不同的数据采用不同数据存储方式、通过数据索引、元数据等的建立,在组织管理层面达到一体化的效果。
3. 基于要素类的一体化数据模型设计 统一时空框架下的多维海量异构多类型数据一体化存储组织模型,从本质上来说是数据模型。内容上涵盖包括空间数据和与空间相关的经济统计等非空间数据, 空间数据又具有多种模型实现方式。
然而, 不论是何种数据,研究的最终目标是实现一体化的存储组织管理,本文提出基于要素类的一体化数据模型设计方法,以解决多中心多源异构数据的一体化存储。