论文部分内容阅读
近年来,大规模问题引起了人们越来越多的关注。大规模数据对机器学习算法提出了更高的计算复杂性要求:包括存储和计算两个方面。 支持向量机(Support Vector Machines,SVMs)在很多领域具有很好的泛化能力。一般而言,标准支持向量机和其它的一些改进算法本质上属于批量学习的核方法,以至于它们不能很好地处理增量学习和在线学习。由于空间和时间消耗过大,支持向量机不能很好地处理大规模问题。对于某些问题则会产生大量的支持向量(Support Vectors,SVs),这通常意味着更长的测试时间。 在本文中,我们提出一种在线增量型支持向量机(Online-incremental Support Vector Machine,OI-SVM)。OI-SVM算法包括三个主要部分:学习原型点(Learning Prototypes,LPs)、学习支持向量(Learning Support Vectors,LSVs)和桥。算法首先学习输入数据的原型点并根据输入数据的概念自适应地调整原型点。第二部分主要根据前面求得的支持向量和现有的数据原型点来学习新的支持向量。第三部分是将求得的支持向量加入到现有的数据原型点。OI-SVM在公开数据集上进行测试,实验结果显示OI-SVM可以有效地解决大规模问题,能够降低计算工作量和存储容量,同时也能够实现增量学习。实验证明,本文提出的OI-SVM和现有代表性SVM方法相比,OI-SVM生成了较少的支持向量,并在不损失预测精度的情况下,较好地减少了训练时间和测试时间。