基于耦合关系的医生用药异常分析

发布日期:2017年1月26日
基于耦合关系的医生用药异常分析 基于耦合关系的医生用药异常分析

本内容试读结束

下载后可阅读完整内容,立即下载

近些年来,医患关系受到广泛关注。如何准确地挖掘异常用药是制约医生和缓减医患关系的关键。本文提出了一种检测医生用药异常的总体框架。该框架集成处方数据的耦合相似度度量和变色龙聚类算法,

近些年来,医患关系越来越引起人们的重视,尤其是对医生滥开检查单、过度用药、开大处方等问题。究其原因,一是医学的复杂性和医生的诊治水平因素;二是经济原因。医院过于市场化的发展,医务人员的收入与医院的经济效益直接关联,开单提成、药物回扣等以药养医行为屡见不鲜;三是法律规章制度。例如在医疗事故鉴定法中规定了医生在鉴定过程中举症倒置的制度,这可能导致医生对病人做大量检查、开具较多药物等“防御性”的行为[1]。

针对上述问题,本文提出一种检测医生用药异常的框架。此框架包含三个阶段,第一阶段,定性分析,将处方划分为相似团体,在相似团体下进行医生用药异常检测。第二阶段,定量分析,首先,针对复杂的处方数据,提出了基于耦合关系的处方相似度度量方法。然后,应用变色龙算法对处方数据进行聚类。第三阶段,异常检测,应用自定义的聚类指标检测医生用药异常。

大多数相似性度量都是基于数据之间相互独立的假设,但是在处方数据中,药物之间存在紧密配合与相互影响的关系,即耦合关系。考虑了耦合关系之后的医生处方用药异常检测,能够更准确地挖掘到医生用药异常情况。

论文其余部分的组织如下:第2 节描述相关工作和相关概念, 包括耦合相似度计算和变色龙聚类等。

第3 节给出了基于耦合关系的医生用药异常分析框架,包括定性分析,定量分析和异常检测。第4 节在真实处方数据上进行了充分的实验,验证了所提出的框架和挖掘方法的有效性。

2. 相关工作和相关概念 2.1. 相关工作 相似度用于衡量对象之间的相似程度,是数据挖掘和自然语言处理的基础,在诸如聚类、异常点检测等数据挖掘技术中广泛使用。由于描述数据对象的属性多种多样,相似度计算方式也分为很多种。计算数值属性的相似度常用欧几里得距离、曼哈顿距离和闵可夫斯基距离。离散属性有二值属性和多值属性,Jaccard 系数[2]是计算具有非对称二元属性的对象间的相似度的常用方法。序数属性是指其属性值之间具有意义的序或排位,而相继值之间的量值是未知的[3]。余弦相似度是查询检索中常用的相似度计算方法,可用来计算文档之间的相似度,也可以计算词条间的相似度[4] [5]。耦合相似度是不承认属性间以及对象间的相互独立,认为属性间以及对象间存在耦合关系。耦合相似度可以对离散属性[6]和数值属性[7]进行度量,针对不同类型的数据,使用的具体度量公式不同。关于离散属性的耦合相似度的具体内容在2.2.1 节有详细介绍。



相关标签