论文部分内容阅读
随着现代社会经济的发展和计算机技术的进步,我们越来越要求生活和工作环境变得智能化,而主导现代智能系统的核心就是机器学习。机器学习是人工智能的一个核心的研究领域,已经成为整个计算机领域中最活跃、应用潜力最明显的领域之一。
机器学习有两种风格的方法,即整体学习方法和局部学习方法。整体学习是先对数据适定一个分布,通过这个分布来描述数据的整体信息。然而当分布不能被正确的估计时,将会产生不好的效果。为了克服这个困难,人们建议采用局部学习方法。这种方法不需要假定分布,而是直接从数据中获取局部的有用信息用以对数据进行建模。机器学习领域非常流行的学习方法如人工神经网络和支持向量机都是属于局部学习风格的。但是局部学习方法也有自身的缺陷,主要表现在丢弃了数据在空间中的趋势信息,而实际上这些信息的应用是能够明显改进学习性能的。
基于这些考虑,本论文提出局部学习风格下进行推进的机器学习理论,推进方式是引入数据在空间中的趋势信息,用以控制局部学习的过程,使得学习出的模型具有更好的推广能力和稳健性能。
本论文的工作及创新之处在于:
1.对作为本论文的重要思想来源之一的高维仿生信息学中的一些基础的计算问题给出了严格化的分析,提出一种计算点到单形距离的递归算法。
2.本论文提出了一种覆盖框架,并在此基础上开发了一种新的神经网络模型——主方向神经网络(PDNN)。
3.提出和深入研究了一种体现局部推进学习特性的回归模型——点分散回归模型(PSR)。
通过一系列的研究工作,本论文论证了局部推进的机器学习的优越性:一方面不需适定数据分布的模型;另一方面,能够克服局部学习丢弃数据在空间中的趋势信息的问题。因此局部推进的机器学习可以看成是在局部学习和整体学习之间巧妙权衡的结果。