论文部分内容阅读
在Map-Reduce的分布式环境框架下,基于微分隐私与主成分分析,并与熵、误分类增益、基尼指数等统计量相结合,提出了一种新的在分布式环境下的隐私保护特征选择算法,实现了在保护数据集隐私的同时保护特征的隐私.仿真实验结果表明,该算法具有较好的性能,能够在保护一定程度隐私信息的同时,有效地进行特征选择.