【摘 要】
:
为了确保模型的精确度,传统机器学习算法需要收集大量的原始数据进行模型训练.一方面,人们享受着高精度模型给生活带来的便利,例如图像处理,文字识别等,另一方面,人们也面临着数据的隐私泄漏问题,引起了人们的广泛关注.如何保证在不泄露用户隐私的情况下安全地进行回归模型训练,或根据已有模型进行安全预测成为当前机器学习中亟需解决的问题.针对如何不泄露用户隐私的情况下进行安全回归模型训练的回归学习问题,本文提出
论文部分内容阅读
为了确保模型的精确度,传统机器学习算法需要收集大量的原始数据进行模型训练.一方面,人们享受着高精度模型给生活带来的便利,例如图像处理,文字识别等,另一方面,人们也面临着数据的隐私泄漏问题,引起了人们的广泛关注.如何保证在不泄露用户隐私的情况下安全地进行回归模型训练,或根据已有模型进行安全预测成为当前机器学习中亟需解决的问题.针对如何不泄露用户隐私的情况下进行安全回归模型训练的回归学习问题,本文提出了基于安全两方计算的隐私保护回归模型,该模型主要基于信息论意义下完备的加法秘密共享方案和安全两方计算协议.在这种秘密共享情形下,该模型通过使用一个辅助服务器,由两个非共谋半诚实的主计算服务器进行主要的回归学习的计算过程.全文的主要思路为:首先通过观察回归学习问题中的常规实现算法,给出对该算法进行隐私实现时所涉及基本运算的两方计算协议,例如秘密共享形式的加法和乘法运算等;其次,考虑到协议中不可避免会出现实数,给出此情形下安全实现两数比较的协议等;最后,结合以上协议给出回归学习问题中常规算法的隐私实现形式,并进行实验对比.实验表明,在该隐私保护模型下的隐私保护协议能安全地实现常规算法的所有步骤,给出一致的计算结果,且总体的方案耗时在可接受范围之内.同时实现了保护用户原始数据的隐私,也实现了保护模型的隐私,对研究其他机器学习算法的隐私实现具有一定的借鉴意义.
其他文献
鱼粉是我国养殖业不可或缺的蛋白质饲料,就目前我国应用最广泛和成熟的鱼粉生产技术而言,并不能够从生产工艺上来避免臭气的产生,若不对臭气进行处理,会对附近的居住人群及其生存环境造成危害。解决废气污染的方法有多种,光催化技术凭借其处理效率高、对降解反应条件要求低、催化材料原料充足、可以氧化多类污染物等优势,成为大家研究的热点。通过对浙江某设备制造有限公司调研,发现目前利用光催化技术降解鱼粉废气的装置存在
现场可编程门阵列(Field-Programmable Gate Array,FPGA)具有功耗低、并行性高和计算速度快的特点,新一代FPGA还具有动态可重构功能,进一步提升了器件灵活性和计算效率。FPGA
目的:对养血平肝汤治疗肝阳上亢型偏头痛的临床效果进行观察,以期能为肝阳上亢型偏头痛的临床应用提供资料和数据参考。材料与方法:将符合纳入标准的60例肝阳上亢型偏头痛患
本文主要内容有两部分构成.第一部分讨论了 Poisson代数的平凡扩张,给出了扩张代数是Poisson代数的条件;第二部分引入了 BiHom-Poisson代数与BiHom-Poisson模,并将Poisson代数的平凡扩张的相关结果扩广到BiHom-Poisson的情形.
非线性发展方程与天文学、生物学、医学、力学、物理学等学科中的非线性现象紧密相连.因此,研究非线性发展方程的精确解,在非线性科学发展的进程中有着举足轻重的意义.目前,虽然已有很多关于求解非线性发展方程精确解的可行方法,但由于其本身的复杂性和独特性,至今还没有一种方法是通用有效的.本文主要利用Hirota双线性方法、正定二次函数法以及KP约化方法,对(3+1)维广义BKP方程、(3+1)维Mimbo
[目的]恶性肿瘤是人类的第二大死亡原因,其中消化道肿瘤的发病率在各系统中排在首位,结直肠癌(Colorectal cancer,CRC)作为消化道最为常见的肿瘤之一,其发病率仍呈增长趋势。
增强现实作为计算机图形学中的热门研究领域,经过长期的研究与发展,已经形成了一套比较完备的理论体系。随着近些年摄像头、屏幕技术的发展以及硬件计算能力的突飞猛进,增强
背景:妊娠期糖尿病(gestational diabetes mellitus,GDM)是以胰岛β-细胞功能受损和胰岛素抵抗为特征的糖耐量异常状态,是妊娠期最为常见的代谢类疾病。近年来,GDM的发病率呈
图G的点荫度va(G)是指G的顶点集V(G)的最小划分数,使得每一个划分集的点导出子图是一个森林.图G的k-森林染色指存在一个映射φ:V(G)→{1,2,…,k},使得任何一个点导出的子图G[Vi]是一个森林,其中Vi是指颜色为i的顶点所组成的集合.图G的点荫度亦指G有k;-森林染色的数fk的最小值.设L是V(G)的一个列表配置.若图G有一个森林染色φ,使得对每个顶点v都有φ(v)∈L(v),则称
关联分析是数据挖掘中一种实用的技术,能够挖掘项集之间中令人感兴趣的规律或联系.然而随着现代社会的高速发展,其积累的数据的数据量也是庞大的,因此除了需要对计算机等硬件有更高的要求之外,对应的算法也应该得到改进.经典的Apriori算法的缺点是候选项集以及规则的数量随着事务数量的增加和事务最大宽度的增加等因素以指数级别的方式增加,其计算复杂度和时间复杂度也是急剧增加.而每一次计算候选k-项集的支持度计