非平衡数据集分类方法探讨

来源 :计算机科学 | 被引量 : 0次 | 上传用户:xieym28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于数据集中类分布极不平衡,很多分类算法在非平衡数据集上失效,而非平衡数据集中占少数的类在现实生活中通常具有显著意义,因此如何提高非平衡数据集中少数类的分类性能成为近年来研究的热点。详细讨论了非平衡数据集分类问题的本质、影响非平衡数据集分类的因素、非平衡数据集分类通常采用的方法、常用的评估标准以及该问题中存在的问题与挑战。
其他文献
大数据应用是目前各界关心的重要问题,本文通过南通市综合数据管理平台的建设,对大数据给政府统计工作带来的变革以及如何借力大数据运用实现模式创新进行了探讨,并对政府统
本文将身体消费作为研究的核心,通过对女大学生的具体身体消费行为的实证研究,从消费社会学和身体社会学视角,揭示了当下女大学生群体在身体消费行为背后隐含的文化和社会含
随着民主化进程的加快,死刑废止已经成为世界的潮流。国内废除死刑的呼声也越来越高,但是在我国立即完全废除死刑还不现实。然而必须对死刑的适用进行严格的限制。关于死刑适
目的:考察注射剂中不溶性微粒的差异,并研究其对微循环功能的影响。方法:以盐酸氨溴索注射剂为模型药物,采用显微镜计数法和光子相关光度法检测4个厂家盐酸氨溴索注射剂中不
近年来,电子商务继续快速发展,成为世界经济全球化的助推器。电子商务的应用已经成为决定企业国际竞争力的重要因素,电子商务正在引领世界服务业发展,并影响着未来商业发展模
<正> (一)关于本市的发病概况淋巴结结核是一种比较普通的疾病,其中以颈部淋巴结结核为最常见。由于颈部的淋巴结非常丰富,结核菌可由口腔及咽喉部的淋巴组织,如扁桃腺及腺样
通过第21届世界大学生运动会篮球比赛中,中国队对部分国家队二次进攻情况的统计与分析,发现二次进攻的成功率高低对比赛结果影响很大,有时甚至能左右比赛的结果。针对影响二
新历史小说是上个世纪末中国文坛最为引人瞩目的风景之一。也许正因为如此,尽管新历史小说迄今差不多已是繁华落尽,但与新历史小说相伴生的研究与批评却依然还保持着方兴未艾的
人脸检测中,模板匹配前往往需要对图像窗口进行灰度分布标准化,而灰度分布标准化则要先算出图像窗口的灰度均值及方差。在积分图像基础上,提出和应用平方积分图像,实现了一种
论文从动漫桥的工程特点入手,在现行建筑工程质量管理与控制模式的基础上进行创新,借助现代技术研究高难度工程项目质量控制方法,使最终提出的质量控制方案得到了多重保障,研