论文部分内容阅读
统计学习理论是Vapnik等人提出的一种小样本学习理论,着重研究在小样本情况下的统计规律及学习方法性质,为机器学习问题建立了一个较好的理论框架。支持向量机是在统计学习理论的VC维理论和结构风险最小化原则基础上发展起来的。由于采用结构风险最小化原则代替经验风险最小化原则,较好的解决了小样本学习的问题;又由于采用了核函数的思想,它能把非线性空间的问题转换到线性空间,降低了算法的复杂性。因此,支持向量机在很大程度上解决了模型选择、过学习、非线性、维数灾难等问题。正因为它具有完备的理论基础和出色的学习性能,该技术已经成为目前模式识别领域中最先进的机器学习方法,并在很多领域都得到了成功的应用。
本论文主要在如下方面进行了研究和探讨:
(1)回顾了统计学习理论研究的基本问题及主要内容,介绍了支持向量机的发展和国内外研究现状,讨论了将支持向量机应用于固体矿产识别中的意义。
(2)介绍了机器学习理论的基本原理和方法,问题的表示,期望风险与经验风险,复杂性与推广能力。
(3)统计学习理论的核心内容和支持向量机的理论基础是:经验风险最小化准则下统计学习一致性的条件,函数集的学习性能和VC维,推广性界的结论,结构风险最小化原则和在此基础上建立的小样本归纳推理准则,如何实现新的计算方法。
(4)支持向量机基本思想,何谓最优分类面,如何将其推广到广义最优分类面,以及核函数的概念。支持向量机包括支持向量分类机和支持向量回归机,讨论了目前常用的分类支持向量机及最优化解法。介绍了支持向量回归机的训练算法和性能估计,本文采用的算法基于自适应回归支持向量机。
(5)实现了支持向量机方法在Matlab中的程序运算,并用理论数据检验了程序的正确性。在前几章的理论研究基础上与传统神经网络进行了对比,指出其优越性,并用理论数据分别用支持向量机和BP神经网络进行仿真比较,验证支持向量机的泛化能力强于BP神经网络。
(6)将支持向量机分类方法应用于鲁西金刚石预测中。经过详细研究与精心选择,从地质环境、金刚石与指示矿物、物化探异常等多个角度提取了20个特征,然后对鲁西地区常马矿带、西峪矿带和沂南地区的21个未知异常进行了分类与识别,识别出6个可能含矿的远景区,为今后该区的开采工作提供了指导意义。