论文部分内容阅读
支持向量机是Vapnik等人提出的一种以统计学习理论为基础的机器学习方法,它以结构化风险最小化代替经验风险最小化作为优化准则,在最小化样本点误差的同时缩小模型预测误差的上界,从而提高了模型的泛化能力,即使在小训练样本的情况下理论上也可以得到很好的效果。支持向量机的基本思想是通过一个非线性映射将输入数据映射到一个高维内积空间并在这一高维特征空间中线性可分,因此它可以很好的解决样本高维问题。另外,支持向量机通过解一个线性约束的二次规划问题得到全局最优解,不存在局部极小值问题。
尽管支持向量机理论日趋完善,但由于各个应用方向间的差异性,直接应用支持向量机往往达不到最优的结果。因此需要针对这些应用方向上各自的特性分别进行研究。本文着重研究了支持向量机在四个方向上的应用:恒星光谱识别、软件质量预测、软件可靠性增长建模和信息检索。
恒星光谱识别是恒星天文学中的一项重要技术。根据恒星光谱噪声高、维数高的特点,提出了小波降噪结合支持向量机的方法对其进行分类。
软件质量预测是对软件质量水平进行阶段性的评价。由于传统的分类模型不能充分的体现软件模块的特性,本文提出一种基于支持向量机技术的软件质量预测模型。在软件工程的不同阶段,可以分别选用一般分类模型、控制第二类错误的分类模型和排序模型。
软件可靠性增长模型是评价软件产品可靠性指标的有效工具。为了解决传统软件可靠性增长模型不能很好适应外界情况变化的问题,提出利用支持向量回归理论建立软件可靠性增长模型。
搜索引擎是帮助人们获取有用信息的必要工具。为了提高垂直搜索的质量,我们提出利用支持向量机技术从上下文中提取锚文本并对每个词赋予不同的权重,以增强查询目标信息,从而提高检索精度。
从相关的实验结果中可以看到,上述模型在相应的应用中均可获得较好的性能,并且有较高的实用价值。