论文部分内容阅读
在现实文本分类任务中,存在大量不均衡数据,常规的分类算法并不能适应这些不均衡的数据,同时还需要兼顾算法的训练速度和分类准确率,这要求设计一种能解决该类问题的算法。本文设计了基于Liblinear和单边Bagging的集成分类算法,在对不均衡的数据进行分类时采用自适应优化Liblinear的惩罚因子的方式,提升了分类的准确率;同时实现了Liblinear在Bagging的方式下比单分类器的分类效果的提升,并能适应大规模数据集的处理。