【摘 要】
:
频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集合有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此
【机 构】
:
中国人民大学信息学院 北京 100872
论文部分内容阅读
频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集合有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(differentially private top-k pattern mining).该算法利用指数机制从候选频繁模式集合中挑选出top-k个携带真实支持度计数的模式;采用拉普拉斯机制产生的噪音扰动所选模式的真实支持度计数;为了增强输出模式的可用性,采用后置处理技术对topk个模式的噪音支持度计数进行求精处理.从理论角度证明了该算法满足ε-差分隐私,并符合(λ,δ)-useful要求.实验结果证明了DP-topkP算法具有较好的准确性、可用性和可扩展性.
其他文献
1985年8—10月间,息县张陶乡赵楼行政村小学伤寒爆发流行,共发生149人,发病率高达32.5%,无死亡病例,现将调查结果报告如下.基本情况:赵楼村位于县城东北,约20公里,有20个自
人们会感到奇怪,医务人员不接触石棉,怎么会得石棉肺呢? 情况是这样的:某县医院一位年轻护士,参加工作前后身体一直很衰弱,经常咳嗽、胸闷、憋气、四肢无力不能上班,经治疗
为了贯彻“预防为主”的方针,控制病毒性肝炎的发生和流行,保障人民身体健康,保证“抓革命,促生产,促工作,促战备”的顺利进行,拟订《病毒性肝炎预防方案》。一、在各级党委
数据流子空间聚类的主要目的是在合理的时间段内准确找到数据流特征子空间中的聚类.现有的数据流子空间聚类算法受参数影响较大,通常要求预先给出聚类数目或特征子空间,且聚
高中思想政治课是对学生进行马克思主义政治经济学、哲学和公民思想品德教育的必修课,是高中德育工作的主要渠道之一.高中思想政治课与具体、直观、形象的初中思想品德课程对
氯丁二烯(Chloropene)是生产氯丁橡胶的单体,能抑制中枢神经系统,刺激皮肤、粘膜,并为亲肝性毒物。对人体免疫系统的影响,至今报导甚少。故于1984年对××化工厂从事氯丁二
长途电话迟缓接续制是在电路生产能力不能满足业务需要时采用的。为了提高电路利用率,迟缓接续台采用固定值管电路的方式和固定的对方局工作。在这种情况下,每一座席(话务员
柑桔全年一次性土壤施肥技术柑桔全年采用一次性土壤施肥,省工,省成本,操作简便。我局多年来对不同柑桔品种进行试验,均取得很好的效果,现已大面积推广使用。全年进行一次性土壤施
1967年以来,我省白喉年发病率一直控制在0—0.22/10万之间,但1985年因局部地区暴发流行,使发病率上升到0.32/10万。为进一步采取控制措施,我们随机抽取西宁市6—15岁学令儿