基于游记文本内容的旅游场景知识图谱的构建

发布日期:2020年1月9日
基于游记文本内容的旅游场景知识图谱的构建 基于游记文本内容的旅游场景知识图谱的构建

本内容试读结束

下载后可阅读完整内容,立即下载

[目的/意义]:传统以旅游本体概念为基础的知识表示形式,侧重对静态特征的描述,缺乏对动态特征的 *通讯作者。

在线旅游目的地信息服务是指针对出游用户在目的地的游玩需求所提供的有关目的地景区、餐饮、当地玩乐、购物、住宿、交通等方面的在线信息参考服务。相比于地方景区所提供的官方景点介绍, 游客更倾向于浏览其他游客生成的在线游记。

来自《2018 年中国景区旅游消费研究报告》的数据显示, 59.7%的游客会在在线旅游网站进行门票预订,近九成用户选择移动端。可见基于用户真实体验的长篇游记以及评论是游客借助群体智慧进行旅行规划的重要信息来源。而对于旅游行业的各大OTA 平台来说,提供个性化的智能旅行服务是当前的热点研究问题,在线游记中涵盖了各类用户对目的地的评价信息,成为企业直接了解游客真实感受的关键数据源。由此可见,针对游记文本内容的挖掘是获取旅游目的地相关知识的重要来源之一。并且将大众所积累的“经验知识”进行有效地表示与定期的更新,不仅能够成为游客进行旅游行程规划与决策的依据,也是企业实现智能化客服服务的动态知识库。

然而,鉴于文本内容本身语言表达的复杂性,目前针对游记本身知识提取方法的研究比较匮乏。仅有的研究主要从游记中挖掘主题,缺少对游记中旅游路线、旅游情感、旅游时间等知识的利用。并且现有针对游记文本挖掘的知识表示形式多采用图网络的方式,缺失语义的联系,不利于应用层面的推理。

因此,本文将充分挖掘游记中的情感信息,将旅游路线的顺承关系作为知识关联的方式,构建旅游场景知识图谱。

2. 相关工作 2.1. 旅游领域知识图谱研究现状 国外旅游本体的研究起步较早并日趋成熟,目前为止,已经有许多研究机构尝试开发专门的旅游本体。相对经典且应用较广的旅游本体主要有:旅游开放联盟标准规格(OTA Specification),旅游休闲词库(The Thesaurus on Tourism and Leisure Activities) [1],旅行本体(Onto Tour) [2],旅行目的地本体[3]。

国内旅游本体研究起步较晚,对旅游本体的研究主要是信息系统中的应用以及信息检索。冯欣[4]提出的旅游信息系统中包含了旅游信息本体、旅客本体以及语义web 浏览器,本体参考OTA 分类方案和



相关标签