论文部分内容阅读
随着数据共享的不断深入,对描述数据产生与演化原理的世系工作流(Provenance Workflow)进行共享发布的需求日益迫切,世系工作流在追踪历史信息、数据恢复、数据来源引用等方面有重要应用价值,直接对世系工作流进行共享发布存在泄露工作流隐私风险,世系工作流共享发布中的隐私保护问题已成为研究者关注的热点。针对现有世系工作流模块隐私与结构隐私保护方法存在的不足,提出维持溯源查询可用的隐私保护世系工作流发布方法与维持关键路径可用的隐私保护世系工作流发布方法。
论文主要工作如下:
(1)针对已有面向模块隐私的保护方法割裂了模块与工作流结构间的关系,未兼顾模块在数据演化过程中所起到的重要程度,导致发布的世系工作流存在溯源查询可用性较差等问题,提出维持溯源查询可用的隐私保护世系工作流发布方法。通过采集大量工作流随机执行过程中的模块参与样本,构建贝叶斯网络模型,衡量工作流中相关模块间的依赖程度,从而确定不同隐私模块在工作流溯源查询中所起作用;提出针对个性化模块隐私的保护方法,基于所构建贝叶斯网络,划分工作流的强、弱关联模块,设计不同隐藏策略,将对隐私模块的隐藏处理维持在工作流局部从而减少对原工作流结构的修改,以维持溯源查询可用性。
(2)针对已有基于匿名的工作流路径隐私保护方法未关注对路径真实长度的隐藏,且当目标节点间路径数目低于匿名强度k时,维持图结构不变的权重扰动方法难以满足隐私保护要求等问题,提出一种维持关键路径可用的隐私保护世系工作流发布方法。引入工作流(k, ε)-关键路径匿名隐私保护模型,保证工作流中目标模块间关键路径满足 k-匿名;提出世系工作流关键路径匿名方法,设计权重扰动与模块分解策略,实现不同场景下(k, ε)-关键路径匿名,在有效避免对世系工作流增加伪信息的同时,防止基于关键路径的隐私攻击。
理论分析与实验结果表明,所提方法能够在避免世系工作流隐私泄露的同时,有效维持工作流特定应用的数据可用性。
论文主要工作如下:
(1)针对已有面向模块隐私的保护方法割裂了模块与工作流结构间的关系,未兼顾模块在数据演化过程中所起到的重要程度,导致发布的世系工作流存在溯源查询可用性较差等问题,提出维持溯源查询可用的隐私保护世系工作流发布方法。通过采集大量工作流随机执行过程中的模块参与样本,构建贝叶斯网络模型,衡量工作流中相关模块间的依赖程度,从而确定不同隐私模块在工作流溯源查询中所起作用;提出针对个性化模块隐私的保护方法,基于所构建贝叶斯网络,划分工作流的强、弱关联模块,设计不同隐藏策略,将对隐私模块的隐藏处理维持在工作流局部从而减少对原工作流结构的修改,以维持溯源查询可用性。
(2)针对已有基于匿名的工作流路径隐私保护方法未关注对路径真实长度的隐藏,且当目标节点间路径数目低于匿名强度k时,维持图结构不变的权重扰动方法难以满足隐私保护要求等问题,提出一种维持关键路径可用的隐私保护世系工作流发布方法。引入工作流(k, ε)-关键路径匿名隐私保护模型,保证工作流中目标模块间关键路径满足 k-匿名;提出世系工作流关键路径匿名方法,设计权重扰动与模块分解策略,实现不同场景下(k, ε)-关键路径匿名,在有效避免对世系工作流增加伪信息的同时,防止基于关键路径的隐私攻击。
理论分析与实验结果表明,所提方法能够在避免世系工作流隐私泄露的同时,有效维持工作流特定应用的数据可用性。