差分隐私保护的K-means聚类算法及其在推荐系统中的应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:darklbueyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,需要考虑的第一要务是如何正确合理的使用大数据给日常生活带来便利,同时还需要考虑信息泄露的问题。推荐系统在一定程度上解决了大数据带来的信息过载问题,而差分隐私技术则可以达到信息保护的目的。本文设计了差分隐私保护的K-means聚类算法,它利用差分隐私技术解决K-means聚类中用户隐私泄露的问题。此外,将差分隐私保护的K-means聚类算法与RBM算法结合设计出推荐系统,解决大数据时代的信息过载问题。通过调研了已有的差分隐私K-means聚类算法和相应的推荐算法,重点考虑了两方面的内容。一方面,如何将差分隐私技术应用到K-means聚类中保护用户隐私属性的同时还能够保证聚类结果的可用性;另一方面,如何将差分隐私技术保护的K-means聚类算法与RBM结合设计出一个全新的推荐算法,主要研究工作包括:(1)针对K-means聚类算法中的用户隐私信息泄露问题,本文提出了一种通过聚类合并与适应性添加噪声的高效差分隐私K-means聚类算法。设计思路为:首先,在数据集中选出多于指定聚类个数的数据点作为初始聚类中心点;然后,在每次迭代优化中心点过程中加入适应性的噪声;最后,待聚类稳定后将多个聚类合并为指定数目的聚类。(2)针对大数据背景下的信息过载问题,本文设计了差分隐私保护的K-means聚类与RBM相结合的电影推荐算法。具体的思路为:首先,通过差分隐私保护的K-means聚类算法将数据集中的数据点划分成不同的子类;然后,根据RBM算法对每个聚类各自生成推荐模型。当一个用户有推荐需求时,首先判断该用户所属的聚类,然后根据该聚类对应的推荐模型对用户的行为进行预测,得出用户可能感兴趣的一些项目。
其他文献
目的1了解肝胆管结石合并糖尿病带T管患者自护能力、心理状况与生活质量的现状。2探讨肝胆管结石合并糖尿病带T管患者生活质量的影响因素。3分析肝胆管结石合并糖尿病带T管患
中华蜜蜂是我国特有的授粉昆虫,对维持我国生态系统的平衡性方面具有重要作用。近年来,冷胁迫问题在我国频繁发生,对中华蜜蜂的生存造成极大影响。褪黑素是一种胺类激素,最新
小学数学作为基础教育的重要学科之一,对培养学生思维能力和促进学生发展起着至关重要的作用。思维导图以可视化的形式把知识和图融合在一起,帮助学生建立新旧知识之间的联系
在ERP广泛应用的今天,如何更好地将ERP系统与行业特色相结合,使ERP更好地为企业财务管理服务是本文探讨的方向。文章从ERP的发展历程着手,结合ERP在财务管理中的一般应用,分