本文针对保险公司如何预判断客户续保概率这一问题,依托大数据的条件,综合运用反向传播BP神经网 *通讯作者。
目前我国车险市场巨大,据统计,我国汽车保险行业的保险收入在3000 亿元左右,并以逐年递增的趋势发展。我国在2000 年前后经历了两次车险费率改革,但效果并不显著,各大车险公司纷纷通过恶性价格竞争和高成本营销手段赢得市场,导致车险市场急剧恶化,财险公司难以盈利。后来行业协会对整个行业进行调整,规定了行业基线,市场才有所好转。但与此同时,大部分车险费率的制定都主要遵从“从车主义”,导致目前中国车险定价模式单一,车险费率条款、产品同质化严重。“从车主义”费率模式系统整体比较简单,但其局限性也十分突出。根据交通统计资料的数据可知,发生交通意外超九成都是由于驾驶员因素造成[1],故针对投保顾客的特征进行续保预测具有重要实用意义。
通过近年来数字化和数据挖掘技术的发展,可预见到未来的车险定价模式的转换。转变后的“从人主义”可以通过对驾驶人的驾驶经验、驾驶习惯来制定车险保费,使拥有不同驾驶习惯的驾驶员拥有属于自己独特的定费标准,这更符合保险中的公平互利原则,也使车险保费制度更具有多样性和竞争性。
车险定费的“从人主义”需要大量的数据分析,通过对大量已有的客户数据行进分析,对客户的投保类型进行分类,并挖掘出车险客户潜在的投保规则,从而对不用驾驶习惯的投保人制定不同的投保方案。
然而,在中国保险运营研究领域中,目前业界对客户的数据仍然停留在了储存阶段,数据没有经处理分析,也并未具体应用到实际场合,2016 年唐俊虎等人[2]曾利用大数据所得的信息,对客户进行星级划分,但其准确率并不理想,同时也缺乏对提取到的客户特征进行说明。
2. 国内研究现状 目前国内对车险续保概率预测的研究并不多, 特别是运用数据挖掘预测车险续保概率的研究。
倪琪、刘骅飞、田雪颖(2011)利用某保险公司的车险续保数据, 用逐步回归和数据拟合求出了车险保单各因素对续保率的影响因子,讨论了哪些因子对续保率有较大影响[3]。王钧等(2011)运用粗糙集理论(RS)产生规则和灰度关联度法,挖掘出车险保单数据中潜藏的续保规则[4]。本文采用BP 神经网络,利用机器学习的方法对客户进行精准画像。
3. 问题提出 目前业界普遍对数据的挖掘应用不够,缺乏对客户信息的合理充分利用。本文通过运用神经网络对客户信息特征加以提取,提出有效方法以解决以下两个问题: 1) 问题一:对已有的大量车险保户信息进行处理,构建出精准客户画像模型,通过此模型得出影响