机器学习的分类问题中不均衡问题算法研究

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:xiazaikankan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题中的不均衡问题目前是一个被国内外学者关注的(相对地)新问题。本文主要以分类不均衡问题和类不均衡问题的算法为主要研究内容,试图分别从数据预处理和模式选择这两个方面来改进和研究不均衡问题相关算法。目前解决分类不均衡问题主要基于抽样的技术,有两个相关研究方向,一个是非充分抽样技术,另一种是充分抽样技术。就一般的两分类问题而言,非充分抽样算法的主要思想是剔除样本点数目较多的那类样本点,使得两类样本点数目均衡。之前算法的主要缺点在于没能有效地利用剔除出来的样本点进行学习。本文主要基于半监督学习的思想来利用这些样本点提高算法的泛化能力。充分抽样技术的思想主要是复制样本点数目较少的那类样本点,之前的研究一直考虑数据结构是一种线性分布的情况下的复制算法。本文主要基于最小闭包球算法提出了一种充分抽样的算法来解决非线性数据结构的数据集中的充分抽样问题。本文最后根据类不均衡问题的特点,从模式选择的角度考虑,提出了一种利用η-one—class中参数 v的几何意义的算法来解决类不均衡问题。
其他文献
熵是一种信息不确定性的度量,包括随机不确定熵、模糊不确定熵以及模糊随机不确定熵等。Liu发展了不确定理论,建立了可信性理论、模糊随机理论等,提出了基于可信性理论的模糊变
新一轮的基础教育改革正在进行,但在教学管理中存在诸多问题,阻碍了教育改革的顺利实施。在初中思想品德课堂管理过程中同样存在这样的问题,课堂管理过程存在哪些问题,如何进
在机械制造、材料质量的优劣直接影响机械设备性能的高和低,所以在生产加工过程中,材料的质量通常采用严格的审查和检测机制.本文研究了机械制造工艺选择的材料分析,供同行进
近年来,我们普陀区委自觉实践“三个代表”重要思想,从巩固党的执政地位的高度出发,采取切实有力的措施,真正把“立党为公、执政为民”的本质要求落实到各项工作中去,赢得了
即使初始条件十分光滑,双曲守恒律方程的解也可能出现间断.这种光滑性的丧失对数值算法的设计和数值解的模拟提出了挑战.有限差分算法是数值算法中一个十分重要的的热点研究
竖井钻机是机械化凿岩专用设备,具有钻孔效率高、成本低、安全可靠和使用范围广等特点,主要于垂直矿井井筒和大桥桥墩孔的掘进施工。目前大部分竖井钻机均使用液压缸来实现钻
语文教学不但是交际的工具,更是思维和做人的工具。本文分析了独立人格的内涵及当前初中语文教学中对独立人格培养的现状,并从几个方面出发,结合笔者教学实践,探讨如何在初中
代数表示论是近三十多年来代数学的一个新的重要分支.目前,代数表示论发展的特点之一就是与代数几何的交叉和渗透.其中,沟通代数表示论和代数几何的桥梁是三角范畴(导出范畴)的
In this paper,we study lag synchronization between two coupled networks and apply two types of control schemes,including the open-plus-closed-loop(OPCL) and ada
课堂是一个充满活力的生命整体,处处蕴涵着矛盾,其中预设与生成之间的平衡与突破就是一个永恒的主题。下面我就结合《勇于承担责任》这一教学案例,谈谈如何处理好初中思想品