基于先验医学知识的风险预测模型

发布日期:2020年1月3日
基于先验医学知识的风险预测模型 基于先验医学知识的风险预测模型

本内容试读结束

下载后可阅读完整内容,立即下载

基于先验医学知识的风险预测模型

通过电子健康记录预测潜在疾病风险任务是近年来医疗领域的研究热点。随着机器学习研究与应用的快速发展,经典机器学习模型渐渐无法满足日益增长的数据量和复杂的数据分析需求,而深度学习中神经网络模型可以解决机器学习无法解决或难以解决的问题。现有疾病预测工作中没有对先验医学知识的明确考虑。本文提出了一种新的、通用的框架,称为风险预测任务,它可以使用后验正则化技术成功地将离散的先验医学知识应用到所有最先进的预测模型中。本文以卷积神经网络建立风险预测模型,并加入先验医学知识,以梯度下降算法进行优化。实验证明,与传统深度学习中的卷积神经网络相比该模型能有效提高风险预测的准确率。

先验医学知识在医疗领域起着重要作用。

当一个病人去看医生时, 医生首先会检查病人目前的症状, 然后会仔细检查病史,如药物、吸烟史、饮酒史、家族史等,这些都是疾病的危险因素。然而,将先验医学知识直接应用于EHR 数据是极其困难的。一方面,医学知识具有随意性或异质性。一些疾病可能与年龄有关(持续价值),而另一些则是由吸烟或饮酒等习惯引起(分类价值)。另一方面,几乎所有的医学知识都用规则来表示。因此,将离散的任意医疗规则转化为连续的真实价值是一个发人深省的问题,即使我们能够得到先验医学知识的实值表示,如何将先验医学知识与预测模型合理结合仍然是一个挑战。

本文提出框架PRIME (Prior Medical),使用后验正则化技术成功地将离散的先验医学知识应用到所有最先进的预测模型中。PRIME 将先验医学知识建模为后验正则化,并使用对数线性模型学习期望的后验分布,它能够区分不同先验知识对风险预测的重要性。在三个医疗数据集上的实验结果表明,提出的PRIME 框架对于风险预测任务是有效的。

2. 相关工作 2005 年,美国医疗卫生信息与管理系统协会在年会上提出了电子健康概念为:电子健康档案是深度数字化的、上下文关联的病人终身医疗记录,从时间跨度上覆盖个人从生到死整个生命周期,从内容上强调个人信息[1]。目前我国EHR 技术正处于起始阶段。在过去的10 年里,美国医院采用电子健康档案(EHR)系统的数量激增,部分原因是2009 年《卫生信息技术促进经济和临床卫生(HITECH)法案》(health Information Technology for Economic and Clinical health, Act of 2009)为医院和医生采用电子健康档案系统提供了300 亿美元的激励[2]。根据2016 年美国国家卫生信息技术协调员办公室的报告,近84%的医院至少采用了基本的EHR 系统,比2008 年增加了9 倍[3]。此外,医生采用基本的和经过认证的电子病历的比例从42%增加了一倍多,达到87%。虽然最初的设计是为了从操作的角度提高医疗效率,但许多研究已经发现临床信息学应用的更多用途。特别是EHR 系统中包含的患者数据已经被用于医学概念提取、



相关标签