矩阵的低秩近似算法及其应用

被引量 : 0次 | 上传用户:vsrabbithhf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的不断发展和互联网的快速普及,人们收集数据以及存储数据的能力都大大提高。在过去十年里,无论在科学研究还是在社会生活的各个领域都积累了大量的数据。如何对这些数据进行分析以发掘数据蕴含的有用信息以及如何有效管理这些数据已经成为计算机科学和应用数学领域共同关心的中心话题。许多的机器学习(如核学习,度量学习)和数据管理问题(数据差分隐私)都可以以矩阵的形式表达,然而在实际应用中往往涉及到百万甚至千万条记录或样本,基于矩阵的数据分析技术的空间和时间复杂度上会随着问题的规模呈二次方增长,这使得很多大规模的应用马上变得不可行。因此近似一个目标矩阵而令数据分析技术更精确更适合于大规模的实际应用已成为当今机器学习和数据管理领域十分热门的话题。受到支持向量机、压缩感知和非负矩阵分解等稀疏和低秩等技术的启发,人们开发了一系列基于矩阵分析技术的机器学习和数据管理算法。本论文主要讨论了矩阵的低秩近似算法以及在机器学习和数据管理中的应用。总的来说,本博士论文主要有三点贡献。1)提出了一个快速的算法来解决低秩二次半正定优化问题。低秩矩阵近似算法在大规模机器学习上是一个非常有效的模型,因为它不但减低内存和运行时间的复杂度,而且在保持着高准确率的同时提供了一种很自然的正则参数的方法。在本论文中,我们讨论了一类特殊的非凸二次矩阵半正定优化问题。虽然问题是非凸的,我们研究了这些问题的一些特殊结构,从而设计了一个快速收敛的局部最优的算法。而且,我们提出的算法运行效率高,在一系列机器学习中重要的具体问题上都表现了很好的可拓展性,这些问题包括稀疏特征值,距离度量学习以及核学习问题。大量在UCI数据集上的实验结果表明我们提出的算法有着运算速度快和测试精度高的优点。2)提出了一个双边贪心策略的低秩半正定优化算法。很多的机器学习任务(如度量学习和流型学习)都可以归约为凸半正定规划问题。为了满足很多大规模的机器学习任务需求,如何设计一个鲁棒的、可扩展的、适合大规模的半正定规划问题是很多学者一直在探讨的问题。在本文中,我们提出了一种新颖的双边贪心优化(BILateral Greedy Optimization, BILGO)算法求解一个大规模数据集上通用的半正定规划问题。和以往的方法不同,BILGO在每一步优化迭代中采用了一种双边的搜索策略,它通过使用上一步的解和一个秩1矩阵的线性组合来决定当前的半正定的解,而这个秩为1的矩阵可以通过计算当前迭代的下降方向的主特征值向量来快速获得。通过优化双边组合的系数,BILGO总是能降低评价函数,一直到KKT最优条件满足为止,因此算法能保证收敛到全局最优解。事实上,对于一个-精度近似的解,BILGO收敛的所需迭代次数为O(∈-1)。我们提出的算法因此可以成功地结合当前传统的秩1更新的算法和梯度下降的算法的效率。最后一点,也是本论文的主线,就是BILGO通过简单的修改就可以处理低秩约束的半正定优化问题,低秩算法因此可以改进我们原来的贪心算法,因而使得我们的优化更加鲁棒和快速。我们的在大规模的实验分析表明BILGO在一系列问题上都取得了较好的效果。3)提出了一个在差分隐私框架约束下的快速准确的批线性查询处理优化算法。差分隐私是一种很有前景的用于对敏感数据统计查询的隐私保护处理模型。该模型通过在每个查询的结果上注入随机噪声而使得攻击者根据加噪音后的结果从理论上难以推断任何个人记录是否存在在统计查询中。差分隐私化的查询处理的主要目标是最大化的查询结果的准确性,同时满足所承诺的差分隐私度。以往的研究,特别是李等人建议用适当的策略矩阵,作为一个整体处理一批相关查询的方案比单独地处理这些查询精度高得多。然而,就我们所知,对于任意的查询集,目前还没有有效的可以找到一个很好的策略矩阵的优化算法。现有的方法要么所产生的策略矩阵质量差(往往比最直接的方法差),要么就是即使对于中等大小的维度数据都需要非常昂贵的计算开销。基于这样一个出发点,我们提出了矩阵的低秩机制来解决差分隐私下的线性查询批处理优化问题。该模型是差分隐私下第一个实用的基于低秩近似算法的线性查询优化模型。再者,我们证明了低秩机制所取得的精度是差分隐私下的任何机制的理论下界相近。大量真实数据下的实验表明,我们提出的低秩机制性能的效果都大大优于现存最具代表性的方法。本学位论文采用排版系统LATEX编写。
其他文献
<正>前言设计一只精准的机械表芯不是短时间可完成的,需要汇聚举世百贤,钻研无数年月才能成功。历史上一些鼎鼎大名的科学家如伽利略Galileo Galilei(1564-1642)、惠更斯Chri
会议
目的了解盐碘含量调整后郑州市孕妇的碘营养水平,为科学补碘提供依据。方法在郑州市所辖各县(市、区)各随机调查到医院、妇幼保健院做孕产期保健的孕妇,采集日间随意尿样,测
改革开放后,我国对外经济交往日趋密切,民营企业对外投资也处于迅猛发展时期。由于一些民营企业不规范运作,不适应时代的经济发展要求,资不抵债,走向破产。破产的民营企业文
<正>职工提问:2014年6月16日,崔某入职岑羲金融服务公司(以下简称:金融服务公司)担任会计一职。2016年6月20日,崔某升职为金融服务公司的财务负责人,并与公司签订了保守商业
由于破产别除权的优先性、不可分性仅在弱势意义上成立,以担保物权作为破产别除权的理论基础值得商榷。现行《企业破产法》及其相关司法解释出台后,担保物被明确规定为属于债
文章通过分析职业能力的内涵及学校教育对特教学生与家长沟通能力培养的现状,提出加强特殊教育专业学生与家长沟通能力的措施,即将人际沟通、人际关系心理学等纳入专业必修课
山西省作为我国的能源基地,为我国的工业化发展提供了重要的能源供给,为我国的经济发展做出了重要的贡献。进入新世纪之后,经济全球化、科技化发展的方向越来越明确,科技作为
在中国古代历史上,柔然是继匈奴、鲜卑之后,出现在蒙古高原上的第三大游牧民族政权。它在约一个半世纪的历史中,从始居地出发,铁骑踏遍大漠南北,驰骋于草原东西,创建了强大的
奥巴马政府上台后,对缅甸实行"务实接触"外交,在政治、经济等方面同缅甸加强联系和接触,推动缅甸的民主化进程。在此过程中,援助是美国使用的重要政策性手段之一。美国一方面
从时域和频域两个方面介绍了行波效应下结构地震响应的各种分析方法及各方法的优缺点和适用范围,后对桥梁结构、大跨空间结构、普通建筑结构、大坝结构、地下结构等各类结构