加权最大夹角间隔核心集向量机的不平衡数据分类

来源 :山东大学学报(工学版) | 被引量 : 0次 | 上传用户:c472559561
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了处理大规模数据和不平衡数据分类问题,提出了一种新的分类方法,利用基于最大夹角间隔的核心集向量机算法实现对大样本数据的分类;针对不平衡数据分类问题,通过对不同的样本给予不同的权重,来提高算法的分类性能。加权最大夹角间隔核心集向量机方法不仅能够有效地解决不平衡数据的分类问题,而且能够实现对大样本数据的快速训练。 In order to deal with the problem of large-scale data and unbalanced data classification, a new classification method is proposed to classify large sample data by using kernel-based CMM algorithm based on the maximum included angle interval. According to the problem of unbalanced data classification, Different samples give different weights to improve the classification performance of the algorithm. The weighted maximum included angle kernel kernel vector machine method not only can effectively solve the problem of unbalanced data classification, but also can quickly train large sample data.
其他文献
根据国家发展改革委价格认证中心统一部署,广东省价格认定系统严格按照价格认定法治建设年活动要求,结合本省工作实际,把法治建设与更准确高效地打击犯罪活动结合起来,与提升
北京及其周边地区西邻燕山山脉,东南部面向渤海,南部则为华北平原,自古是中国经济文化人口的中心。随着中国经济的发展,国力增强,北京地区已经成为中国的经济重要增长极之一。在夏
1901-2004年平均海表温度通过旋转正交经验正交函数(REOF)分解得出前三个模态分别为长期变暖海表温度异常型、类厄尔尼诺-南方涛动(ENSO-like;包含ENSO和北太平洋年代际振荡)型
南京是我国重要的工业基地,工业集中在化工园区,而工业是废气排放的主要来源,所以有必要关注南京化工园区的大气环境,对其进行规划,从而可以改善或保持南京化工园区现有大气环境质量,促进化工园的环境、经济、社会等方面协调持续地发展。本文对化工园区的环境质量现状作了调查与评价,特别是大气环境质量现状和大气污染源的调查与评价。 为了具有代表性,在化工园区选取了典型区域(包括南京所有的大气环境三类功能区和
学位
领导班子的团结问题,始终是各级领导关注和探讨的一个重要课题。毛泽东同志对领导班子团结问题有深刻的认识和透彻的分析,而且有一整套可以为我们掌握和运用的方法。今天,我们重
  本文研究中国北方春季沙尘暴预报方法。本研究利用1970-1997年NCEP再分析资料以及中国北方典型强沙尘暴事件,对形成强沙尘暴的天气系统进行了分类。并对各型的天气系统进
瓦斯压力测定一直是个难题,尤其在煤层里测定更是难以保证。通过分析和模拟直接测定法中钻孔与封孔器之间的流体泄漏形式和影响因素,开发了承压三相泡沫瓦斯压力主动式测定仪
本文首先从动力学分析入手,讨论在海温加热及其异常变化两种作用下,热带低频振荡的周期及其稳定性的变化;然后分析了一次强El Nino事件-1997/1998年期间,在赤道东、西太平洋
厄尔尼诺-南方涛动(El Ni(n)o-Southern Oscillation,简称ENSO)是热带太平洋大尺度海-气耦合作用的主要模态,它对大气环流的影响会造成亚洲季风强度的不稳定,导致中国东部部分地区