论文部分内容阅读
支持向量机模型(SVM)是近年来统计机器学习领域研究的一个热点,它建立在结构风险最小化理论基础之上,是一种对数据分布假定比较宽松的非参数分类方法,通过优化问题求解寻找符合要求的判别面。已有的大部分有关支持向量机的研究主要集中在模型风险的上限估计和复杂性估计方面,理论上已经证明支持向量机可能达到很小的模型风险,在各种实证研究中,支持向量机与其他模型相比也显示出较低的预测误差,然而对支持向量机模型估计性质的研究目前还不多,本文希望通过对支持向量机模型判别面置信带的研究对这方面有所探索。 模型预测预测是统计学习领域进行模型比较和评价的一个最重要的准则,本文指出了用预测误差进行模型评价的局限之处,提出用支持向量机模型判别面的置信带作为它的一个补充。本文中给出了两种对支持向量机模型判别面构造置信带的方法,在均匀分布和正态分布条件下对两种置信带进行了模拟比较,并且与Logistic模型判别面的置信带进行了模拟比较。 本文共分为四章:第一章说明研究的意义,并对本文中涉及的相关模型进行简要的回顾;第二章中提出两种对支持向量机模型判别面构造置信带的方法;第三章是数据模拟部分,对类条件分布为均匀分布和二元正态分布两种情况进行数据模拟,利用第二章中提出的两种方法在支持向量机模型中对模型分界面构造置信带,对两种置信带进行比较,同时通过数据模拟对样本量和分布参数变化时支持向量机模型分界面置信带的性质进行研究;第三章中还在两种数据分布的条件下将Logistic模型作为对比模型对两种模型判别面的置信带进行比较。第四章中讨论了本文的不足之处和继续研究的方向。