基于Solr/Lucene的数字化古籍书库的研究与实现

发布日期:2018年12月28日
基于Solr/Lucene的数字化古籍书库的研究与实现 基于Solr/Lucene的数字化古籍书库的研究与实现

本内容试读结束

下载后可阅读完整内容,立即下载

为满足读者对古籍的检索阅读的需求,提高古籍的利用价值,保护古籍的完整性,并且针对大数据量下

古籍作为中华历史文化的产物和依托,具有重要的学术意义和历史文物价值。古籍大多以纸质为载体保存,而且大多都很脆弱,大量的古籍深藏于仓库之中,不方便学者借阅,更加难以得到学者的合理利用[1]。近些年来,信息技术的快速发展推动了各行各业信息化管理的转型过程,在信息化逐渐成熟的背景下图书信息化建设水平也越来越高[2],数字化书库以其图书的快速检索、在线阅读等功能受到读者的广泛欢迎。

当前,图书系统中主要采用两种检索模式:1) 以传统的数据库为基础,利用成熟的商业数据库使用SQL 语句检索图书信息;2) 利用全文检索技术原理,开发搜索引擎,如百度、Google 等。随着数据量的不断增大,数据库的检索效率大幅度降低,并且数据库检索不支持复杂的查询方式。本文采用全文检索技术,提出了一种以传统数据库为存储,基于Solr/Lucene 的分布式检索的方案,为古籍用户读者提供更加快捷多样化的检索服务,并采用Nginx 作为静态服务器,提供古籍图书在线阅读的方案,为读者提供良好的在线阅读体验。

2. 技术综述 2.1. SpringBoot 框架 Spring 是一款为了解决企业应用程序开发复杂性而创建的开源的、轻量级的框架。Spring 最重要的核心功能是IoC (Invertion of Controll,控制反转)和AOP (Aspect Oriented Programming,面向切面编程)。

其中IoC 用于管理Java 对象和Java 对象之间的依赖关系,AOP 用于抽象和解耦业务代码和公共服务代码(如日志、安全、事务等)。IoC 和AOP 两大核心功能可以简化开发,使得代码具有良好的松耦合性和可测试性,为开发人员提供了很大的便利。

SpringBoot 是由Pivotal 团队提供的一个全新的基于Spring 的框架, 但大大简化了Spring 应用程序的各个方面的配置,包括搭建程序框架、配置、开发和部署等。SpringBoot 基于“约定优先配置”的原则, 相比于Spring 框架,开发人员不再需要大量繁琐的模板化配置[3]。

2.2. Nginx 技术 Nginx [4]是一个开源的、轻量级的、高性能的HTTP 和反向代理服务器,是俄罗斯人Igor Sysoev 为



相关标签