论文部分内容阅读
联机分析处理(On-LineAnalyticalProcessing,简称OLAP)技术作为基于数据仓库(DataWarehouse,简称DW)的一种应用,利用多维数据模型,对企业已有的各种数据进行分析,发掘业务变动与趋势,有效支持企业的科学管理与决策。
随着OLAP技术的广泛使用,对数据更深入的分析,使数据拥有者越来越担心各自的隐私是否会在OLAP过程中被泄露给不信任的人。这种担心的加剧使得OLAP的进一步普及受到一定的阻碍。因此,目前面向隐私保护的OLAP研究已经引起了学术界的关注,成为近期的一个研究热点,并已经取得了一定的成果。由于OLAP的多维立方体构建和使用涉及多种类型和性质的隐私,现有的研究大都只针对某种特定的隐私进行保护,并取得了不错的效果;但是,目前尚没有一个很好的方法能够同时满足OLAP过程中出现的多种隐私保护需求。
针对这种状况,本文提出了一个统一描述OLAP过程中各种隐私保护需求与对应保护方法的框架模型,并在此基础上设计了一种基于聚集干扰的OLAP隐私保护方法,有效地保护了OLAP过程中的多种隐私。本文的主要研究内容与成果如下:
1.针对OLAP的隐私保护需求,结合相关方法的研究,提出了OLAP的三阶段隐私保护体系架构,全面地分析和描述OLAP全过程的隐私保护需求与对应保护策略。
2.在上述OLAP的三阶段隐私保护体系架构下,设计了一个基本聚集结果随机干扰(BasicAggregationRandomPerturbation,简称BARP)方法,在多个互不信任的数据源和一个非可信中心站点的条件下,实现了对多种隐私的有效保护,同时保证OLAP系统的可用性。并在此基础上,针对不同层次的隐私保护要求,进一步扩展了该方法,使之具有更强的灵活性和可应用性。
3.针对提出的隐私保护方法,量化定义了干扰后聚集计算结果的可用程度(Usability)和隐私保护程度(Privacy)的度量标准,对隐私保护方法的效果进行有效地评估。
由于隐私的复杂性,出现了很多不同的隐私保护方法,这也导致衡量保护方法的指标,尤其是隐私保护程度,有很多不同的定义。本文通过分析和理论推导,定义了具有一定通用性的可用程度和隐私保护程度的度量,作为评估隐私保护OLAP方法的依据。
大数据量的实验证明此方法结合OLAP的特点,能够在保证很好地保护多种隐私的同时,提供了可用程度比较高的聚集结果,成功化解了隐私保护与信息利用的矛盾。