基于图卷积网络的分子气味印象预测

发布日期:2022年2月22日
基于图卷积网络的分子气味印象预测 基于图卷积网络的分子气味印象预测

本内容试读结束

下载后可阅读完整内容,立即下载

自20世纪90年代以来,嗅觉技术越来越受欢迎,并以各种方式进入了商业用途。从化妆品到洗发水,以及带有香味的博物馆和主题公园,嗅觉消费产品已经陡然流行起来,消费者不仅虚心接受,甚至积极寻求嗅觉产品。然而,目前关于嗅觉的研究大多来自于气味分子的电子鼻数据和质谱数据的角度,而这些数据的获取需要耗费大量的人力和时间。因此,我们从一个新的角度出发,将气味分子的结构视为一个由节点和边组成的图,并引入图卷积网络作用于这个图结构来预测气味分子的气味印象。我们在公开的气味数据集上进行了模型训练,预测了气味分子的气味愉悦度、强度和熟悉度得分,均取得了较好的结果,其中气味愉悦度得分预测的平均绝对误差MAE = 8.532,皮尔逊相关系数为r = 0.520 (p < 0.0000001),证实了将气味分子的结构视为图结构而获得的分子信息能够预测气味分子的气味印象。

气味在我们的日常生活中无处不在。随着合成化学的出现,香味产品(香水、化妆品、洗涤剂等)已经以各种方式进入商业应用。然而,气味的合成通常需要熟悉芳香成分及其气味印象[1]。如果我们能够获得每个香味分子的气味印象,将大大简化香味产品的生产过程,并减少从天然作物中提取香味的生态影响[2]。

气味印象是人们对闻到的物质的一种感官印象。在日常生活中,当人们找不到合适的例子来描述某种化学物质的气味印象时,就可以用日常口述的形容词来形容,如“酸”、“草”等。在最简单的情况下,人们使用“愉快”和“熟悉”等口头描述来描述他们闻到的物质的气味。近年来,气味印象预测(如愉悦度、强度、熟悉度等)已成为嗅觉研究的热门话题。研究方法可分为三类:基于物理化学特性的、基于电子鼻(e-nose)的和基于质谱的。

基于物理化学特征的方法是通过分子计算软件(DRAGON)计算出每个分子的描述符信息,并将其作为每个分子的特征信息,从而通过建模得到分子气味印象的预测。2007 年,Khan R.M.等人从语言描述符构建了一个定性空间,并从化学描述符构建了一个类似的物理化学空间[3]。他们发现感知的主轴是气味的愉悦度,并使用主成分分析(PCA)来预测分子的愉悦度。2017 年,Shang L.等人使用分子计算软件(DRAGON)获取气味分子的物理化学参数,并通过BR-C SVM 模型预测气味感知[4]。同年,Keller A.等人在Dream Olfaction Prediction Challenge 中,利用正则化线性模型和随机森林,根据分子的化学信息特征预测分子的感官特性,从而成功预测气味的强度和愉悦度[5]。

基于电子鼻的方法利用电子鼻传感器测量分子气味,获取高维气味数据信息作为分子特征信息,利用机器学习或深度学习算法进行气味预测。电子鼻技术应用在生活的很多方面,如食物异味检测、工业气体检测、疾病检测等[6] [7] [8] [9]。关于分子气味印象预测的研究很多。2010 年,Haddad 等人使用手动特征提取方法从传感器中提取120 个特征,并基于对电子鼻气味宜人性的评估,使用MATLAB 构建三层前馈反向传播神经网络[10]。2019 年, Wu D.L.等人设计了一个POP-CNN 模型,根据从电子鼻获得的气味信息的特征来预测精油的愉悦感。该模型还可用于气味分类和检测[11]。

基于质谱的方法是利用质谱仪通过实验获得各气味分子的质谱数据,然后以原始质谱数据为输入,



相关标签