基于差分隐私密度峰值聚类算法的研究和应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:ssdkln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘能够从大量数据中发掘出有效信息和潜在模型,而聚类分析作为其中的一项重要技术,通过将数据分类来发现特征,被广泛运用于商业、医学、科研等领域。然而,在对数据进行聚类分析的过程中,个人的隐私信息也不可避免地暴露在外,为此隐私保护技术应运而生。差分隐私作为一种基于数据加扰的隐私保护技术,无需关注攻击者所具备的背景知识,因而成为了隐私保护的研究热点。目前,在基于差分隐私的聚类算法中,聚类的可用性往往会因为差分隐私噪声和输入参数的敏感性问题而降低。因此,如何对基于差分隐私的聚类算法进行改进,提高数据的可用性,是解决问题的关键。本文针对传统差分隐私聚类算法不适用于非凸数据集、受输入参数影响较大的问题,首先将差分隐私引入到CFSFDP聚类算法中,提出基于差分隐私的CFSFDP算法。根据CFSFDP聚类算法的特点,将差分隐私噪声分别引入到密度值计算和距离值计算的步骤中,使算法满足差分隐私模型,并对算法进行理论分析和实验对比,以验证其安全性和可用性。其次,针对CFSFDP算法不适用于均匀分布的数据、基于差分隐私的CFSFDP算法存在的聚类精度较低的的问题,引入可达的定义,提出DP-rcCFSFDP算法。对聚类中心点的选取进行了优化,将密度较小的中心点与可达的大密度中心点归为一类,使聚类的可用性得到提升,减小了差分隐私噪声对聚类结果的影响,并通过实验进行验证。最后,将DP-rcCFSFDP算法应用于基于聚类的协同过滤推荐系统中,在数据集中用满足差分隐私的算法进行聚类,缩小最近邻查找范围,计算相似度,产生预测评分并对用户进行推荐,实现隐私保护和推荐准确性之间的平衡。
其他文献
目的:通过剖析“脾主运化”理论内核,联系中医功能脾脏与实质小肠与机体痰浊血瘀证形成关系,将脾、心、小肠关联阐明小肠现代生物学改变与AS发生发展关系。在此基础上,建立脾
本研究的目的在于结合航空发动机中介球轴承可靠性验证需求及现有相关标准,分析验证需求、规划试验项目、改进试验设备,以试验器为平台、以试验为手段,实现航空发动机中介球
无线通讯和传感器技术的发展以及移动智能设备的普及,使得以设备为中心的无线传感网络转为以人为中心的移动群智感知。移动群智感知将感知任务以众包的方式外包给一群拥有智
航空轴承作为支撑发动机转子系统的核心部件,其可靠性是整个发动机转子系统可靠工作的保证,直接影响到发动机的整体性能和寿命。根据国军标要求,航空轴承在装机前必须要在地
与传统主机游戏在我国的发展糟糕境遇不同,我国在智能手机时代的发展初期,便显现出优势,随着智能硬件设备价格被小米等国产厂商拉低,和人民日益增长的可支配收入,中国成为了全球智能手机最大的生产国和消费国,与之而来的是我国移动游戏产业的井喷式发展。借助智能移动支付产业的发展,移动游戏企业出现了与传统行业不同的交易模式和业务特点,进一步影响其收入确认的方式。在新收入准则发布后,由于不同企业财务管理人员对新准
由于天文望远镜各方面性能的提高,天文学的研究和发现有了飞速的发展,人类对宇宙的认识也随之有了很大的提高。随着数据的不断积累,天文学已经到了一个“数据雪崩”的时代。
如今,超高压电网采取集中监控、统一调度的模式统筹管理,变电设备隐患、缺陷的排查很大程度上依赖于设备状态监视系统。这种工作模式下,设备的指标示数往往是在“临界”、甚至“越限”才会被运维人员发现,工作前瞻性不足、贻误“苗头性”缺陷治理时机,工作效率、操作精度受到很大制约,极易造成“小恙成疾”、“小病成灾”的被动局面。当前,社会经济的飞速发展对电网安全提出更高需求,尤其对供电的可靠性、稳定性要求更为严格
感知识别技术是将硬件设备与数据处理技术相结合,从而感知识别周围环境。随着物联网技术的发展,感知识别技术逐步应用于人类生活,如基于雷达的人群密度估计方法、基于RFID的
近年来,随着数据挖掘、机器学习、深度学习等技术的兴起与发展,企业从普通用户处收集到了大量的数据,并对这些数据进行分析处理来了解用户的习惯和喜好,从而向用户提供更加个
因特网技术的不断普及和发展,使得社会对网络的依赖越来越多,网络已成为经济社会发展的重要基础设施。网络在带给人们方便的同时也给社会和个人带来安全威胁。网络入侵检测技术通过对网络流量数据中潜在的入侵攻击行为进行检测识别,为社会和个人提供防护,维护网络安全,抵御网络安全威胁。传统的网络入侵检测技术需要依靠专家知识人工设计特征集对网络数据进行特征匹配,或使用基于机器学习的分类、聚类算法进行检测识别任务。上