粒度支持向量机学习方法研究

来源 :山西大学 | 被引量 : 4次 | 上传用户:as7770420
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machine,SVM)是近年来受到广泛关注的一类学习机器,它以统计学习理论(Statistical Learning Theory,SLT)为基础,具有简洁的数学形式、标准快捷的训练方法和良好的泛化性能,已广泛应用于模式识别、函数估计和时间序列预测等数据挖掘问题。然而,由于支持向量机的学习效率主要取决于数据的规模,迄今为止,针对实际问题中的大规模数据集,支持向量机并未达到人们期待的处理效率。因此如何提高支持向量机的学习效率就成为支持向量机研究所关注的焦点,这也是本文研究的出发点。本文将粒度计算方法与支持向量机相融合,对粒度支持向量机(Granular SupportVector Machine,GSVM)的学习机制和学习算法进行系统的研究,主要内容如下:(1)对现有的支持向量机与粒度计算具体模型的结合方法进行了系统的分析。(2)探索了粒度支持向量机的内在学习机制,在SVM学习框架下,引入粒与粒的内积运算,建立粒度核函数并将之运用于粒度支持向量机的学习之中。首先按样本标签将数据集分为多个粒,然后将每个粒看作参与SVM的训练。通过控制粒的多少从而控制粒的粗细进行训练,最终可以在训练速度和泛化性能之间找到满意的折衷。实验表明,运用粒度核支持向量机可以使训练速度大大提高,同时可获得令人满意的泛化能力。(3)提出了一种基于指数相似度的粒度支持向量机学习方法。针对粒度计算在大规模数据集处理方面的应用,本文引入指数相似度作为划分粒度层次的工具,对数据集建立粒的层次结构,并在不同的粒层次之对进行训练,最终找到合适的粒度范围,并在训练速度和泛化性之间获得满意的折衷。本文研究的内容是SVM研究中的热点问题之一,SVM与粒度计算理论相结合也是新的有益的尝试,研究结果不仅对拓展SVM的学习理论具有重要的理论意义,而且对于实际问题具有直接的应用价值。
其他文献
近年来,随着互联网的快速发展,人们所面临的信息量呈爆炸式增长,传统的信息处理方式受到了极大的挑战。在此背景下,推荐技术作为目前最有效的信息过滤手段之—受到了越来越多的关
本论文基于深度学习的方法对问答领域的两个重要的问题进行了相关的探索与研究。第一个研究问题是问题意图层次分类,对于类别为层次结构的问题意图,设计模型充分利用类别间的层
传统的数据管理模式下,用户自己购买硬件软件,自己管理数据。在经济全球化的今天,一方面,用户的数据量急剧增长;另一方面,用户对数据管理的要求越来越高。这使得传统的数据管理模
研究表明,数字集成电路(IC: Integrated Circuit)测试模式下的功耗可能达到正常功能模式下功耗的两倍以上。因此,如何有效降低数字IC的测试功耗已经成为近年来学术界与工业界普
随着软件技术的发展,静态开发模式已经不能满足需求。以组件的形式开发出来的软件具有结构清晰、易于定制、便于动态扩展等特点,在Linux平台和手持移动设备上已经得到了广泛的
数据挖掘是近年来迅速发展的信息处理技术。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息
在中文信息语言处理领域里,以大规模真实文本为基础的语料库研究和知识自动获取越来越受到重视,建设大规模高质量的语料库成为首要的任务。然而由于现阶段语料库的建立,需要
随着互联网应用和用户的飞速增加,猛增的域名查询量对根服务器和CN顶级域名(TLD)服务器造成了越来越大的负载压力。从降低根服务器和CN TLD服务器的负载、提高域名解析的性能
面向对象分析与设计系统在当今软件企业中有着非常广泛的应用,它有目的地把系统分解为模块策略,并将设计决策与客观世界的认识相匹配,为复杂度越来越高、规模越来越大的软件系统
随着计算机应用的日益普及和深入,软件系统的规模和复杂性不断增大,研制可信软件技术以提高软件系统的质量已经成为十分重要和迫切的需求。   软件开发生命周期可以分为需求