话语承载思想,为推动话语资源的科学组织,促进话语的传播、宣传、研究和阐释,文章对话语元数据开展研究,梳理了话语资源现状,确立话语元数据设计的核心性、扩展性、抽象性和丰富性原则,并基于这些原则建立了一套基于时空场景的话语元数据标准。
随着移动互联网的普及和信息技术的快速发展,网站、APP 等数字信息资源已成为人们主要的知识来源渠道。在党的思想理论建设领域,数字资源的科学建设和高效利用关乎宣传思想政治工作的成效。
党的十九次全国代表大会指出习近平新时代中国特色社会主义思想(下文简称“习近平思想”)是全党全国人民实现中华民族伟大复兴的奋斗指南。当前,研究“习近平思想”是解读我国当前各类政策、顶层设计的基础和重要切入点。承载“习近平思想”的话语是这项研究的原始对象和起点。
本文通过建立“习近平思想”话语元数据(以下简称“话语元数据”)核心标准,为构建思想理论领域话语知识库,整合和开发利用话语资源,突破当下以全文本为主的数据库资源模式奠定基础,并助力于宣传思想政治工作,推动理论思想的研究和传播。
2. 话语元数据的概念和功能 “话语”是对象在各类正式、非正式场合,以官方、半官方的渠道,产生的承载思想的书面或口语化的文献记录。元数据是描述信息或数据资源自身属性和特征的数据,在信息资源组织和管理过程中发挥重要作用[1]。话语元数据是一套通用的,独立于平台的,建立在目录学理论基础上,能够描述话语文本数据属性的模型。
建立话语元数据旨在识别话语资源并追踪话语资源在时空场景语境下的发展和变化, 从而支撑话语研究、解读和宣传。
话语元数据是通过独立于平台、规范统一的方式对话语文本数据的模式予以描述,通过一套资源模型结构来表达话语的通用信息[2] [3]。话语元数据的功能体现在以下几个方面: 第一,话语元数据独立于当下各类“习近平思想”资源数据库平台工具,提供的是一套基于时空场景的话语数据库模型基础建构方案,可以通过编码将话语元数据转换成话语数据库; 第二,话语元数据为现有系统提供对照参考模型,可为现有“习近平思想”宣传数据库系统提供对照和完善参考。话语元数据并不包含数据库或平台特性,提供一种针对“习近平思想”话语资源的通用的元数据描述,助力于该领域资源的科学组织和合理利用。
第三,话语元数据将话语产生的时间、空间和场景抽象为元数据模型,用于还原在线话语产生和发展的时空场景,为开展“习近平思想”话语研究提供拓展空间。
3. 话语资源构成现状 围绕“习近平思想”话语原文,衍生出如图1 所示六大类不同类型的文献,这些文献按照用途被整合在不同的资源平台上。以宣传平台为例,目前收录“习近平思想”文献的权威数据库有三个。分别是由中央网信办指导、人民网·中国共产党新闻网建设的“学习路上——习近平总书记系列重要讲话大型网络数据库”(2014 年建成) [4];由人民出版社开发建设的“中国共产党思想理论资源数据库”(2010 年建成);以及由中宣部(2018 年建成)推出的“学习强国”学习平台[5]。除这三家外,还有大量的类似的习