【摘 要】
:
如今,图数据已经被广泛地应用于现实生活与科学研究当中,有巨大的使用和研究价值.但与此同时,针对图数据的收集与发布中也存在巨大的隐私风险.如何在保护图隐私的同时,发布与收集可用图数据,是目前个人、企业、政府等面临的重大挑战.本文首先从隐私信息所包含的内容、不同的隐私泄露场景,以及敌手模型三个方面深入地剖析了图数据在使用中存在的隐私风险,然后重点从攻击和防御两个角度展开介绍.针对攻击而言,本文分析了当前可行的图数据隐私攻击与攻击量化算法及其算法原理.针对防御而言,本文总结了简单匿名、图修改、聚类,以及差分隐私
【机 构】
:
数据工程与知识工程教育部重点实验室(中国人民大学) 北京 100872;中国人民大学信息学院 北京 100872
论文部分内容阅读
如今,图数据已经被广泛地应用于现实生活与科学研究当中,有巨大的使用和研究价值.但与此同时,针对图数据的收集与发布中也存在巨大的隐私风险.如何在保护图隐私的同时,发布与收集可用图数据,是目前个人、企业、政府等面临的重大挑战.本文首先从隐私信息所包含的内容、不同的隐私泄露场景,以及敌手模型三个方面深入地剖析了图数据在使用中存在的隐私风险,然后重点从攻击和防御两个角度展开介绍.针对攻击而言,本文分析了当前可行的图数据隐私攻击与攻击量化算法及其算法原理.针对防御而言,本文总结了简单匿名、图修改、聚类,以及差分隐私四种图数据隐私防御技术;分析了集中与分布两种数据存储场景下,不同类型图数据使用的各类隐私防御算法,以及数据隐私性与可用性度量方法.最后本文综合已有的研究成果,指出了图数据上隐私保护研究当前存在的问题、面临的挑战,及未来的研究方向.
其他文献
为解决稀疏数据对预测模型带来的负面影响,提高以机场为主体的离港航班延误预测效果,提出一种基于Xgboost模型与Logistic模型相集成的离港航班延误预测方法.将Xgboost模型作为特征转换器,把森林中每棵决策树的叶节点作为新特征向量输入到Logistic模型中进行航班延误预测.通过在未经规范化的稀疏数据上和其它预测方法相比,该方法可以显著提高单独预测模型在稀疏数据集上的预测效果,相较于其它机器学习方法预测效果更佳.
目的:探讨深度学习重建(DLR)较混合迭代重建(HIR)在降低CT肺动脉成像(CTPA)辐射剂量中的作用及对图像质量的影响。方法:前瞻性纳入2020年12月至2021年4月在北京协和医院临床疑诊为急性肺动脉栓塞(APE)或因其他肺动脉疾病需行CTPA检查的患者100例,根据区组随机化分为HIR组、DLR组,每组50例,记录患者的性别、年龄及体质指数(BMI)。HIR组、DLR组噪声指数(SD)分别设置为8.8、15,其他扫描参数及对比剂注射方案相同,分别采用HIR、DLR算法重建。计算有效剂量(ED)及体
为解决投诉举报文本分类困难这一问题,提出一种基于改进果蝇优化算法的文本分类方法.针对果蝇优化算法存在的搜索半径相对固定、种群多样性低等问题,对算法进行改进;采用支持向量机建立文本分类模型,利用改进后的果蝇优化算法对支持向量机的参数进行动态寻优,以此提高模型的分类精度.实验结果表明,该文本分类方法的准确率和召回率相比于文中其它几种对比方法而言均是最高的,验证了其在投诉文本分类问题上具有较高的准确性.
腮腺肿瘤性病变的病理类型复杂多样,术前对腮腺良性与恶性肿瘤的准确判断对手术方式的选择及预后具有重要意义。本文中探讨腮腺肿瘤性病变的影像学诊断思路及功能MRI的诊断价值。
为解决文本分类中因文本数据篇幅长且语义情感分布不均导致分类准确度偏低的问题,提出一种基于分层式卷积神经网络(convolutional neural network,CNN)的长文本情感分类模型pos-ACNN-CNN.通过在嵌入层加入位置编码来捕获文本中的词序信息,结合基于注意力机制的CNN识别不同词语的情感语义贡献度,得到连续两个句子组成的句子对的特征信息;利用CNN提取文本中所有句子对的全局特征,获得最终的分类结果.在IMDB影评数据集中进行的多组对比实验结果表明,该情感分类模型具有更好的分类效果.
为解决矿井探水作业中人工验收效率低、耗时长等问题,提出一种融合交叉熵损失函数的3 DCNN探水作业动作识别模型.使用ReLU非线性化函数和SoftMax交叉熵损失函数,将隐含的特征数据判断分类别后再进行学习,得到较为丰富的批次网络信息图;将批量归一化操作引入到网络结构中,弥补网络模型收敛速率慢的不足,提高模型的泛化能力和鲁棒性,达到有效提高验收效率的目的.经过与其它网络模型对比,实验结果表明,该方法有效解决了人工验收低效率的问题,提高了动作识别的准确率.
根据先天性心脏病远程辅助诊断中实时分析、心音远程听诊以及便携式需求,设计一种可实时心率检测的远程心音采集系统,实现心音信号的无线实时采集显示、音频回放、云端储存、诊断结果回传以及实时心率检测等功能.在此系统的基础上,提出一种适用于低性能嵌入式设备且不依赖于ECG信号的心率检测算法,通过软件包络检波与峰值定位快速准确地实现心率的实时计算.实验结果表明,软件包络检波法在实时心率检测上比希尔伯特提取包络运行效率高3.6倍且精度更高,该系统满足设计需求.
为进一步提升基于骨骼信息的人体行为识别准确率,对人体姿态的骨骼信息进行研究,分析图卷积(GCN)的理论基础,提出一种多尺度时空图卷积(multi scale ST GCN)的方法对骨骼的动态信息进行建模,不同于传统的手工对人体进行自上而下或者自下而上的遍历规则设计方法,而是通过构建网络模型对人体行为的时间空间信息进行自动捕捉,利用图卷积学习人体骨架在空间特征信息,结合多尺度时间卷积(multi scale TCN)在时间层捕获的骨架动作序列信息,增强网络模型对人体骨骼动作信息的理解,将其应用到人体的行为识
目的:探讨产前MRI量化评价法洛四联症(TOF)胎儿心血管结构及脑发育的价值。方法:回顾性收集2011年8月至2021年4月在上海交通大学医学院附属上海儿童医学中心确诊的30例TOF胎儿,孕周为18~33(25±3)周,孕周≤25周17例、>25周13例。收集同期孕周匹配、心脑发育正常的60例胎儿为对照组。于快速平衡稳态梯度回波序列图像上测量胎儿主动脉弓峡部(AoI)、主肺动脉(MPA)直径及TOF胎儿室间隔缺损(VSD)长径,计算MPA/AoI。于单次激发快速自旋回波序列图像上测量胎儿脑双顶径(BBD)
能量CT成像技术发展迅速,近年来在临床的应用越来越成熟,在疾病的诊断中发挥了重要作用。为推动能量CT在我国的规范化应用,中华医学会放射学分会和中国医师协会放射医师分会组织专家参阅大量文献并结合我国的临床实践,经反复讨论并达成以下共识,包括能量CT成像原理、实现形式和技术特点,以及在血管、头颈、心胸、腹部及骨骼肌肉成像等方面的临床应用。