基于深度学习的云端大数据安全防护技术

发布日期:2015年10月29日
基于深度学习的云端大数据安全防护技术 基于深度学习的云端大数据安全防护技术

本内容试读结束

下载后可阅读完整内容,立即下载

云端海量大数据是数据分析的基础,数据本身的安全性和准确性,对数据分析的结果有重要影响。针对云端大数据的特性,融合Hadoop的海量大数据处理以及数字水印相关技术,提出了一种以深度信念网络(DBN)作为智能分类的机制,通过对数据进行多层的训练和调整,对云端海量数据进行计算,得到其分布式表示,进而获取数据的篡改和判断的依据。实验表明,Hadoop和AI的结合,很好的实现了云端海量大数据的安全防护。

伴随着云端大数据[1]时代的到来,传统的关系型数据处理技术已无力处理海量云端大数据。当前, 已有的智能化设备仍然不能像人脑一样进行智能化的学习和干预事务。数据就是命脉,如何以最快的速度响应处理这些数据,如何保障这些海量数据的安全,成为当前研究的一大热点问题。

数据的正确性和完整性是海量数据分析的基础。传统方式下的数据安全保护技术,一般是进行数据隐藏或者信息加密,在数据的处理量上,往往也是以少量数据的处理为主,仅仅采用以往技术,很难解决当下云端海量大数据的安全防护问题。与此同时,在智能化防护性上,例如大数据的智能化分类、被篡改数据的智能化识别、智能化学习以及智能化定位等,传统的数据保护技术很难解决。深度学习(Deep Learning) [2]相关技术的发展,提供了一种新的处理云端大数据安全防护问题的思路。最近几年来,国内外许多学者专家对Deep Learning 进行了深入的研究和探索[3]。

与此同时, Hadoop [4] [5]的快速发展为海量数据的安全保护又提供了一个高效的备选方案。但这两种新的技术,并没有进行相互的结合,只是在各自的领域有所发展。

融合Hadoop 的大数据处理技术以及人工智能中的深度学习技术, 对疑是遭受篡改的数据进行智能化的识别和分类处理,与此同时在进行海量处理过程中,使用分布式的技术方案,实现了快速、准确定位篡改数据,快速恢复被篡改的数据的目标。

2. 智能分类模型 2.1. 受限玻尔兹曼机 Deep Learning 是一个多层的神经网络,是模拟人脑进行分析和学习。深度学习的模型主要是含多隐层的多层感知器,通过将低层的特征,进行抽象组合处理,得到抽象表示的高层数据。这样的逐层抽象和认知的过程,形成分布式表示的数据。

受限玻尔兹曼机[6] (RBM)如图1 所示,是一种马尔可夫随机场。它由可视层v 和隐含层h 构成,并且可视层和隐含层都是条件独立的,即: ()()()()iijjp h vp h vp v hp v h==∏∏ (1)



相关标签