大学生在校园里经常会询问一些关于校园生活的简单而又重复的问题。本系统旨在设计一个智能问答系统,达到节省时间,方便在校师生的目的。信息时代的不断发展使计算机人工智能的开发与应用越来越广泛。本系统运用自然语言处理中的分词、短文本相似度计算等技术,基于MySQL和Spring Boot框架开发为Web应用程序,该程序部署到网上并在本校试用效果良好。
近年来,随着信息技术的发展,人工智能成为当今信息时代的研究的一大热点。而智能人机交互中的自动问答机器人是其中最受追捧的研究之一[1] [2], 这些智能机器人可以给人们的生活带来极大的便利。
高校的学生,尤其是新生,经常咨询一些关于校园知识的问题,例如某快递的取件点在哪,学校的财务处在哪,某老师教什么课程等等。目前获取信息的方式比较原始和低效,主要有询问同学和老师,查询学校公众号等。如果能够用智能的问答机器人自动回复这些简单重复的信息咨询,不仅可以节省时间, 而且也提高了问题的准确度。
这大大方便了学生和老师, 减轻教务员、辅导员、助班和各部门的工作量。
本系统综合高校学生的需求,可用资源以及团队知识水平等因素,基于关键词提取和短文本相似度计算等技术,开发校园百科知识问答机器人,帮助学生解决一些常见的校园问题。
2. 相关研究与研究基础理论 2.1. 国内外相关研究 本系统实现的自动问答机器人是一个智能的问答系统,能对用户输入的校园问题做出回答。问答系统,也叫做自动问答系统,在其相关领域有较为重要的研究价值。国内外在问答系统这方面的研究都有挺多例子,如Start、Cortana、Siri 和国内的“度秘”。在线问答方面的研究也有很多,例如文献[4]。
2.2. 分词技术 分词技术就是把一个文本切分成一个个独立、完整、有意义的词组。本系统采用百度的分词技术对文本进行分词、词性标注和专名识别[3]。而常见的几种字符串匹配方法有:正向最大匹配法、逆向最大匹配法、最少切分法。
2.3. 语义匹配模型 本系统所应用的匹配模型SimNet 是一种有监督的神经网络语义匹配。在语义的表示上SimNet 依然使用隐式连续向量,基于语义的角度从而获取特征相关的信息,利用分类模型经行分类,后根据分类结