基于邻域相关性的聚类数据隐私保护方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:corber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,如何保证数据经过扰动后在数据隐私保护安全问题上同时能够兼顾数据聚类可用性成为难点。如何确保在发布数据的过程中,能够同时满足数据隐私保护安全性与数据聚类可用性,是摆在现实社会中一个极具挑战与艰巨且迫切的问题。然而,尽管可行的扰动方法能够确保经过扰动后的数据自身安全性,但是却严重地忽略了数据聚类的结果。通过对已有的数据隐私保护安全性及数据聚类可用性方法进行深入地研究,发现基于邻域相关性对数据进行扰动,可以更好的达到隐私保护安全性和数据聚类可用性两者的兼容,但仍不能很好地满足两者间的平衡。针对此问题,本文提出了一种基于NCDP扰动方法的改进型方法,基于邻域圆内四象限扰动方法NCCQDP (Neighborhood Correlation Clustering Based On Data Perturbation for Four-Quadrants of Circle)。NCCQDP扰动方法主要从两个角度对NCDP扰动方法进行改进,且通过牺牲空间复杂度,来使得保证隐私保护安全和数据聚类可用性两者之间达到平衡,获得期望中的效果,从而提高隐私保护安全性概率及数据聚类可用性。该算法主要有三个步骤,包括基于邻域密度寻找聚簇质心;对数据点记录集进行粗聚类;对数据进行圆内四象限扰动。最后,本文通过实验对提出的算法进行验证,将NCCQDP扰动方法和已有的RBT扰动方法、NCDP扰动方法进行比较、分析。结果表明NCCQDP扰动方法能够在隐私保护与数据聚类可用性方法两者间达到平衡。最后,讨论了今后进一步改进的方向。
其他文献
移动计算环境的移动性、灵活性等特点使其具有广泛的应用前景,但是它的带宽窄、无线通讯易受干扰等特性也会导致系统出现故障,所以在移动计算环境中引入容错技术是目前研究的
随着现代科技的发展和3C的融合,一场围绕“显示为中心”的无线大革命拉开了序幕。这场无线大革命已经从90年代的数据网络向21世纪的视觉网络迈进,同时数字家庭也从第一代向第二
近年国外HIS(Hospital Information System,医院信息管理系统)领域十分重视中间件技术的研究与应用,国内也进行了大量研究。软件厂商使用中间件技术,主要是为了解决HIS的维护
语料库是研究中文信息处理的基本语言资源。没有语料库的支持,中文信息处理的研究将会寸步难行。语料库在自然语言处理的许多方面都有重要的应用价值,语料库的建立为语言学的研
本文运用爆破理论、放矿理论、松散介质力学、最小耗能原理和数值计算等相关理论,采用实验室研究与理论分析相结合的方法,设计了实验室模型,对崩落体的形成过程与形态进行了物理
面向方面编程(AOP)强调将软件系统中的横切关注点从核心业务中分离,单独以模块化的方式进行实现。这种思想很快被广大程序开发者所接受,相关技术及运用也得到了迅速发展。在
XML(eXtensibleMarkupLanguage)具有强大的数据表达能力以及简单、开放、可扩展等优点,因而逐渐成为互联网上信息发布和数据交换的事实标准。XML研究中的一个关键问题就是如何
安全套接层SSL(Secure Socket Layer)是世界上部署最为广泛的安全协议。传输层安全协议TLS(Transport Layer Security)是SSL的后继。尽管TLS最常见的用途是保证Web通信的安全
近年来,随着Internet、数据存储和信息科学的迅猛发展,大量与个体相关的数据被政府部门或研究机构广泛收集并发布。然而,这些以数据挖掘与知识发现、数据共享等为目的的数据
随着网络技术的发展,计算机辅助教学(CAI)从单机走向网络化;同时,多媒体技术的进步,使它的表现形式更加多样化。当前,网络教学已经成为流行的教学模式。基于网络的计算机辅助教学