基于聚类的高效k-匿名化算法

来源 :NDBC2009第26届中国数据库学术会议 | 被引量 : 0次 | 上传用户:magicMan555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KACA算法是一种较好的基于局部重编码的k-匿名化算法,它产生的匿名化微数据的信息损失少,数据可用性高.但该算法的效率低,不适合匿名化规模很大的微数据.为解决该问题,将高效的聚类算法——c-mocles算法——与KACA算法结合,提出了c-mocles-KACA算法.该算法首先采用c-modes算法将整个数据集划分为较大的类,然后采用KACA算法来分别k-匿名化这些类中元组数大于2k-1的类.实验表明,c-modes-KACA算法产生的信息损失量与KACA算法相近,效率却比KACA算法高得多.
其他文献
描述逻辑中的非标准推理是目前研究者们所关注的焦点问题,它主要包括:最具体概念、最小公共包含、匹配问题及概念的重写等.过去人们主要研究那些不合数量限制的描述逻辑系统,
人机自然交互需要情感模型.在情绪状态自发转移马尔科夫模型中,针对参数的调整能否给个体情绪差异带来影响、带来影响有多大等有关个体情绪区分聚类的问题,提出基于度量多元
最小可辨温差(MRTD)是评价红外热像仪的重要技术指标,传统的测量方法都是基于测量人员的主观判读得到的,结果重复性差。为了解决这一问题,提出基于人工神经网络的客观评测方
描述逻辑是知识工程应用领域中重要的一类知识表示形式化工具.近年来,解决描述逻辑标准推理和非标准推理已成为描述逻辑研究的一个重要内容.文中概述描述逻辑的标准推理和非
为解决因界面而造成的整体系统效率低下的问题,以认知学为理论基础,提出将眼动跟踪技术运用于界面可用性检测.首先讨论了眼动跟踪设备的优势与技术原理,然后以德国汉堡城市轻
针对支持向量机(SVM)参数选择问题,通过分析SVM近似网络模型及分类原理,提出一种基于核相似性差异最大化的高斯核参数快速选择算法(MSD).同时,将MSD算法与基于交叉验证的参数
碳纳米管探针是原子力显微镜新一代探针,在柔软生物样品的微观形貌表征领域有重要的应用价值.研究和分析了碳纳米管原子力显微镜探针和普通硅探针对小鼠IgG蛋白形貌的表征能
Since first report by Murry et al1 in 1986,the role of ischemia preconditioning before sustained coronary occlusion in protecting myocardium and reducing infarc
提出了一种基于隐马尔可夫模型和并行模型组合的特征补偿算法.首先,利用一个包含较多状态的隐马尔可夫模型来描述全部单词特征向量的分布.然后,根据静音段估计的噪声均值和方