伴随着网络技术的发展,各类社交网络所包含的信息也在不断地增大。在数据信息增加的同时也意味着隐私信息泄露的可能性增大。因此在上传和提取用户信息的时候应该考虑到敏感信息的保护,在k-匿名算法的基础上衍生的(a, k)-匿名算法是经典的隐私保护模型,但是随着社交网络的复杂性不断增加,传统的(a, k)-匿名算法不足以满足社交网络中信息隐匿的要求。针对在社交网络中,节点的结构信息和非隐私属性信息等也可能会受到攻击,本文提出一种基于节点分割的(a, k)-匿名算法。该算法对社交网络中带有隐私属性值的节点进行分割,使得节点特征被分割到两个节点里,降低了节点被攻击识别的可能性。实验结果表明,该算法可以有效防御部分攻击造成的隐私属性泄露,同时保证数据保持一定的可用性。
随着计算机技术的不断更新换代,人们交流的方式和工具也是层出不穷。网络社交成为人们获取信息的重要途径,但是在获取信息的同时,与用户相关的敏感信息也存在泄露的可能。根据Ferri [1]等人的研究,绝大多数的人都比较关注其隐私。2019 年,数据泄露的问题随着Facebook 的丑闻,吸引了许多人的眼球,据《纽约时报》的新闻透露,Facebook 和许多公司有多年的数据交易关系,并为一些大公司提供了用户隐私访问规则以外的更多接口。这些事件表明,现在数据的价值利益已经十分巨大,许多公司为了利益枉顾安全,对于隐私信息发布的保护已经变得至关重要了。
传统的数据隐私保护方法自Sweeney 提出k-匿名法[2]后开始迅速发展起来, 衍生出了p-敏感k-匿名[3]和(a, k)-匿名[4]等各种各样的隐私保护模型,文献[5]在p-敏感k-匿名模型的基础上提出针对敏感属性的个性化隐私保护算法,实现了对敏感属性进行个性化隐私保护的目的。上述方法都是面对关系型数据和属性数据的,针对具有图结构的数据,也开始采取k-匿名的思想来进行匿名隐私保护[6]。Liu 和Terzi [7]等人提出了基于度的匿名化方法, 由此出现了许多新颖的图结构数据隐私匿名方法[8] [9] [10] [11] [12]。
Casas-Roma [8] [9]等人通过优化边的选择策略来改进k 度匿名,降低边的修改数目,在图的节点和边缘建立新的节点和边缘,以此来防止敏感信息的泄露。金叶[11]等人提出了一种改进的k 度匿名保护方法, 不依靠度序列来重构图,而是从节点本身出发来修改节点的度并同时修改图的结构,该方法在满足k 度匿名隐私保护需求的同时,也对图结构进行了保护。
在上述诸多的匿名算法中,较少针对社交结构和属性分布之间的关联,而且很少将社交网络和数据表结合起来研究,所以这些算法很难抵御例如攻击者通过图的社交结构或通过属性联合分布特征对某用户隐私属性所进行的推测攻击,通过联立数据表和图进行的联合攻击。此外,许多匿名方案在保持数据可用性时权衡不足,存在过度匿名。同一种属性,在社交网络中取值可以是多样的,有些可能只有部分