【摘 要】
:
大数据等技术支撑着社交网络数据分析领域的发展,同时也使社交网络发布的数据面临隐私泄露的重大威胁。近年来,数据泄露大事件层出不穷。例如,2021年315晚会曝光人脸信息未经本人同意被收集、各大招聘平台随意叫卖简历、个人信息遭暗网兜售等。社交网络,尤其是加权社交网络中包含的个人或企业的隐私信息规模大。如果敏感数据未经隐私保护处理被发布,不法分子可以根据已发布数据预测出与用户或企业相关的隐私数据。与现有
论文部分内容阅读
大数据等技术支撑着社交网络数据分析领域的发展,同时也使社交网络发布的数据面临隐私泄露的重大威胁。近年来,数据泄露大事件层出不穷。例如,2021年315晚会曝光人脸信息未经本人同意被收集、各大招聘平台随意叫卖简历、个人信息遭暗网兜售等。社交网络,尤其是加权社交网络中包含的个人或企业的隐私信息规模大。如果敏感数据未经隐私保护处理被发布,不法分子可以根据已发布数据预测出与用户或企业相关的隐私数据。与现有的隐私保护技术相比,差分隐私模型脱颖而出,目前已应用于保护工业等领域的隐私数据安全。差分隐私拥有其他隐私保护技术没有的优势,它不仅可以抵抗所有背景知识攻击,还实现量化隐私保护效果。因此,本文将重点研究在发布加权社交网络图数据之前,如何利用差分隐私模型提高保护图数据的隐私安全性,同时保证待发布数据具有良好的可用性。针对保护加权社交网络中重要节点及其重要边的隐私问题,本文提出了基于节点度排序和紧密度中心性排序的边添加投影算法EGMA(Edge adding projection algorithm based on node degree sorting and compactness centrality sorting,EGMA)。EGMA算法主要包含三个阶段:构造有序节点集、构造有序边集、构造生成图。首先,根据节点的度和紧密度中心性构造有序节点集;然后,根据有序节点集和边权值构造有序边集,并按照有序边集中加权边的顺序,将边添加到生成图结构中。实验表明,基于图映射思想的EGMA算法在L1误差和边保留度两个指标上的结果均优于其他算法。EGMA算法不仅可以尽可能保留原始社交网络图结构中的节点度和紧密度中心性较大的节点,还可以保留与这些节点相连且权值较大的边。也就是说,EGMA算法保留了加权社交网络图结构中的重要结构信息,同时提高了生成图结构中重要数据的可用性。为保护EGMA算法生成图中节点的隐私信息,本文进一步提出了满足节点差分隐私的度直方图发布算法DHPAKM(Degree histogram publishing algorithm based on K-means algorithm,DHPAKM)。DHPAKM算法实现的思路是:首先,基于EGMA算法修改原始图结构后产生的生成图,统计生成图中节点的度直方图。然后,DHPAKM算法改进k-means聚类算法。DHPAKM算法随机选择一个初始中心点,在迭代过程中寻找并保护新的初始中心点的隐私信息,通过差分隐私实现保护k个初始中心点的隐私信息;然后,对直方图的桶进行聚类和分组。桶分组完成后,DHPAKM算法给不同的分组添加满足噪声。最后,DHPAKM算法发布满足ε-差分隐私的度直方图。实验分析表明,相比其他算法,DHPAKM算法在数据集上的L1误差和KS距离均较小。DHPAKM算法对加权社交网路的隐私保护效果较好,较完整地保留了原始图结构中节点度的信息,发布数据的可用性较高。针对复杂的加权社交网络中社区结构的隐私保护,本文提出了基于改进标签传播算法的社区结构差分隐私算法CSDPA-LPA(Community structure differential privacy algorithm based on improved label propagation algorithm,CSDPA-LPA)。CSDPA-LPA算法利用节点强度和节点的紧密度中心性改进标签传播算法,然后对社交网络进行社区检测并划分社区结构。为进一步保护社区的结构隐私信息,CSDPA-LPA算法通过向边频率中添加噪声后生成扰动的社区结构。为保护社区结构内边权值的隐私信息,CSDPA-LPA算法将对社区结构内边权值的隐私保护转换为对边权值序列的差分隐私保护。然后,合并社区,生成一个实现边差分隐私的含噪社交网络并发布。实验结果表明,在WARE和ASPL指标下,CSDPA-LPA算法均优于其他算法。CSDPA-LPA算法不仅实现对网络结构的保护,还保护了边权值的隐私信息,同时保证了这个社交网络数据的效用性。基于上述算法,本文构建了一个基于差分隐私的数据发布隐私保护系统Data Share,并测试了本文提出的算法对图数据的隐私保护效果。Data Share系统测试结果表明,本文所提出的隐私保护算法隐私保护效果较好,并且发布的数据效用性较好。
其他文献
民办非学历补习教育是指国家机构以外的社会组织或个人,利用国家非财政性经费,面向社会举办,不具备颁发学历文凭资格,在主流学校教育之外、以主流学校教育中的中小学生为对象、开展文化教育类的补习活动。除了补充主流学校教育的课程之外,亦包括符合补习者需要、促进其发展的相关学科性补充内容。改革开放以来,随着经济社会的不断发展,国家相继颁布关于民办教育的各项法律法规,给予民办非学历补习教育生存与发展的土壤。尤其
板蓝根是我国重要的传统中药材之一,由于疗效获得了认可,每年需求达到1万吨以上,然而在其种植过程中,杂草防除是最主要的困难,投入到杂草防除上的成本最大。本研究针对克拉玛依地区膜下滴灌板蓝根田杂草种类进行调查,明确板蓝根田优势杂草种类,由于目前没有登记在板蓝根作物上防除杂草的药剂,通过室内筛选出对板蓝根安全的药剂,并且进行田间试验,进一步明确对板蓝根安全,对杂草有效的除草剂,为板蓝根的杂草防除提供科学
实践表明,提高铝合金薄板的冲压成形性是其在轿车外车身广泛应用的关键。对于铝合金薄板的深冲成形性来说,组织中尺寸较小、密度较高的弥散相是重要的影响因素。目前在汽车车身板领域最有应用前景的Al-1.30Si-0.42Mg型Al-Mg-Si合金中通常添加Mn等微量元素来细化晶粒、抑制再结晶,其在铸锭均匀化处理过程将以弥散相的形式析出。它们的尺寸、密度和分布对合金板材的强度、塑性和冲压成形性有重要影响。为
“双减”政策下,如何让英语学习“减量”不“减质”,让学习回归学校?学校尝试以“情境”为载体的英语戏剧教学。“戏剧教学法”是20世纪70年代开始提出的教学方法,戏剧教学法有利于学生在更真实的情境中学习和使用语言,更能通过戏剧的理解与演绎,进行育人功能的体现。本校结合课标要求及小学阶段设计的话题,进行“情境戏剧”课程的开发,围绕剧本情境、剧本创作、剧本表演等特征,通过英语情境建设、课堂DIE实施、探究
创造教育思想是陶行知教育思想体系的重要组成部分,《创造的教育》一文发表标志着陶行知创造教育思想的初步形成。陶行知所倡导的创造教育是以行动为前提的教育,有行动才能生发思想,有思想才能生发真知,才能创造。创造教育应“以社会为学校”,使得社会含有学校的意味,学校亦含有社会的意味。创造教育要教学做合一,做的最高境界就是创造。创造教育是以生活为中心的教育,是与生活实践相结合,在生活之中求得的、指向更好生活的
两固体表面间的粘着对微机电系统的发展意义重大。在微纳尺度下,机械系统主要受表面效应的影响而非惯性效应。粘着是微机电系统在制造和使用中失效的一个主要原因。随着微机电系统进一步微型化,研究如何避免粘着失效也成为提升系统可靠性的迫切要求。因此,需要开展大量的实验和理论研究深入探讨粘着机理。原子力显微镜(AFM)是微纳粘着力实验的最主要工具之一。实验中的参数对粘着力的测量结果影响很大。其中,接触时间常起到
以T公司生产线为对象,探究通过对生产线工站数量调整、合理分配作业单元的方式提升生产线整体平衡率。引入双遗传算法对该生产线平衡问题采取进一步改善,将作业单元编码,并将优化方案中的作业单元进行交叉变异最终得到全局最优解,最终使生产线的整体平衡率由初始的85.85%提升至97.79%。基于Flexsim仿真软件建立改进后的生产线的仿真模型,统计对比生产线的月产量,验证了改进的效果与改进方法的可行性。
在过去十几年锂离子电池占据了便携式电子市场的主导地位,且目前正受汽车行业大规模应用的重视。但大规模应用受到了成本和性能的制约,其中电极材料是最重要的影响因素之一。另一方面,随着钢铁行业的发展,由酸洗废液产生的酸洗铁红也正逐年增加,不当地处理会带来资源浪费与环境污染等问题。为了解决这些问题,本文以廉价的酸洗铁红为原料,较为系统的研究了制备性能优异的铁氧化物和LiFePO4的参数。首先通过TG-FTI
序列化推荐旨在通过建模用户的历史交互数据(如点击、购买和签到)之间的顺序依赖关系,来捕获用户的动态兴趣(或需求)并为其推荐在未来最可能会交互的物品。近几年,序列化推荐已经成为个性化推荐系统研究中的一个热点问题。尽管研究者已经提出了很多序列化推荐工作,但现有的序列化推荐工作仍然面临着以下两个挑战:第一个挑战,现有的序列化推荐工作未能同时考虑用户偏好的全局稳定性和局部波动性,使用基于标量的加权模式来融