【摘 要】
:
随着信息技术的快速发展,各领域的数据正以前所未有的速度产生并被广泛收集与存储,如何实现数据的智能化处理从而利用数据中蕴含的有价值信息已成为理论和应用的研究热点。数
【机 构】
:
复杂系统安全与控制教育部重点实验室; 重庆大学自动化学院;
【基金项目】
:
国家自然科学基金项目(61633005,61773080);重庆大学科研后备拔尖人才计划(cqu2018CDHB1B04)
论文部分内容阅读
随着信息技术的快速发展,各领域的数据正以前所未有的速度产生并被广泛收集与存储,如何实现数据的智能化处理从而利用数据中蕴含的有价值信息已成为理论和应用的研究热点。数据分类作为一种基础的数据处理方法,被广泛应用于数据的智能化处理。传统分类方法通常假设数据类别分布均衡且错分代价相等。然而,现实中的数据通常具有不平衡特性,即某一类的样本数量要小于其他类的样本数量,且少数类具有更高错分代价。当利用传统的分类算法处理不平衡数据时,由于多数类和少数类在数量上的倾斜,以总体分类精度最大为目标会使得分类模型偏向于多数类而忽略少数类,造成少数类的分类精度较低。如何针对不平衡数据分类问题设计分类算法,同时保证不平衡数据中多数类与少数类的分类精度,已成为机器学习领域的研究热点,并相继出现了一系列优秀的不平衡数据分类方法。本文对现有的不平衡数据分类方法给出了较为全面的梳理。从数据预处理层面、特征层面和分类算法层面总结和比较了现有的不平衡数据分类方法。并结合当下机器学习的研究热点,探讨了不平衡数据分类方法存在的挑战。最后展望了不平衡数据分类未来的研究方向。
其他文献
全面介绍了国内外燃煤脱硫研究的进展 ,包括较新的煤炭微生物催化脱硫、微生物烟气脱硫、等离子烟气脱硫技术等工作原理及其最新的研究进展 ,最后指出同时高效脱硫脱硝是今后
提出基于条件极值的场地标高计算模型,采用该模型进行场地设计可实现地块与地块之间、地块与道路之间的土石方总体最优。通过工程实例介绍应用Civil3D实现该模型的场地设计方
随着公路建设的飞速发展,连续箱梁结构因其造型美观、整体性好、施工工艺成熟,已成为高速公路曲线桥及匝道桥上较为理想的桥型之一,应用越来越广泛。但施工中连续梁支架垮塌
通过优化环量分布,开发了一种快速的风力机叶片气动优化设计方法.方法中引入了全自由尾涡模型,通过并行处理技术和快速多极子方法加速计算.采用傅里叶级数参数化叶片附着涡环
怀孕妇女在生产前,为避免生下缺陷儿而赴医院接受产前检查手术,因为医务人员对检查资料解读失误,未发现胎儿之缺陷或发现胎儿的缺陷但未告知准父母,使其误以为胎儿身心正常,
教学语言在教学过程中有着举足轻重的作用。语文教师的教学语言会对学生的情感、认知和思维都产生一定的影响,作为一名语文教师需要具有扎实的语文基础,良好的修养,灵活的思
介绍英语音标"天平记忆法"的结构形式,说明如何借助人们最熟悉的汉语拼音有规律地去记忆,让人们对音标背得轻松,学得自在,从而提高英语的教学效率。
以泉州南安非物质文化遗产“佛妆服饰技艺”为研究对象,考察其脉络、历史、传承概况及抢救措施等,并对其制作工艺做了系统梳理和考究。挖掘本土闽南文化资源,传承闽南传统手工技
钢筋混凝土在服役过程中,常常发生因氯离子侵蚀而导致钢筋锈蚀的现象,进而造成钢筋混凝土结构的失效,尤其是在海洋工程中。因此,提高钢筋混凝土抗氯离子侵蚀能力对钢筋混凝土
TC4钛合金在室温下具有较大的变形抗力及较高的应变硬化指数,因此在TC4钛合金的管、棒、线材生产中通常采用热拉拔工艺,但较高的加热温度会引起TC4钛合金的性能下降,同时大幅