支持向量机(Support Vector Machine, SVM)是一种监督式学习机器学习分类算法,自出现以来,已经成为应用最广泛的分类算法。本文探讨了云环境下隐私保护的SVM训练问题,并提出了一种新的隐私保护的SVM外包训练(PPOSVM)协议。与已有的方案相比,除了隐藏数据样本的隐私性,新协议首次考虑了样本数据与标签对应关系的隐私性,隐藏了密文数据的访问模式。同时,采用豪斯霍尔德变换以及置换矩阵进行加密操作,使得新协议具有很高的效率。严格论证了协议的输入输出隐私性以及效率,同时,通过广泛的实验分析验证了所提协议的实际性能,进一步证实了理论分析。
目前生活的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。国际数据公司(IDC)报告称,2011 年全球创造了约1.8 ZB (=1021 字节)的数据[1]。如物联网,网络物理系统,智慧城市[2],智能医疗,智能导航[3]等每天都会产生和收集大量数据[4]。大数据时代给日常工作生活带来了巨大便利,如果能够合理并高效地对海量数据进行处理,就有可能产生巨大的商业价值。
近年来人工智能技术高速发展, 已经广泛应用在社会生活的各个方面[5] [6], 成为人类社会智能进化的重要技术手段之一。而人工智能的发展决定了大数据技术的发展,由于人工智能技术具有强大的特征提取和抽象能力,整合多源信息,处理异构数据。大数据技术也为人工智能技术的发展提供了充足的训练样本。两者相得益彰。
人工智能算法——支持向量机(SVM)是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM 训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。同时支持向量机也是一种广泛应用的机器学习算法,例如在在医疗,金融生物信息等领域。Devikanniga 等[7]使用支持向量机进行有效诊断肝病,Farhadian 等[8]使用支持向量机设计了牙周病决策诊断支持系统。Sivaram 等[9]使用支持向量机进行金融产品收益预测。Byvatov 等[10]将支持向量机应用在生物信息学中。
大数据时代, 在本地计算资源和存储资源有限的情况下,对于大规模数据处理是一件很苦难的事情, 而云计算服务可以很好地解决这个问题,本地设备可以将数据外包给计算能力和存储能力都很强的云服务器,并向云服务器支付一定的费用,从而换取相应的计算服务,将支持向量机(SVM)外包训练给云计算服务提供商,有利于不熟悉支持向量机技术和本地计算资源有限的数据所有者使用完整的支持向量机分类功能。但支持向量机的训练通常需要庞大的数据样本进行支撑,因此将支持向量机训练外包给云服务器是合理高效的。
但是将支持向量机训练给云服务器会产生数据安全问题,可能会导致意思隐私数据泄露。例如,病人的生理特征数据以及诊疗数据关系到病人的个人隐私,如果可能会造成社会歧视并且对病人造成更大的心理伤害。金融机构的用户数据关系到用户的财产安全,一旦泄露可能会使不法分子有机可乘,给用户带来财产损失。而训练产生的机器学习模型也是模型拥有者的知识产权,其中包含着商业价值,一旦