一种主动学习和协同训练相结合的半监督微博情感分类方法

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:guoguangyun_09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】针对微博情感分类时未标注样本多和已标注集少的问题,提出一种新的方法。【方法】在协同训练算法的基础上引入主动学习思想,从低置信度样本中选取最有价值的、信息含量大的,提交标注,标注完后添加到训练集中,重新训练分类器进行情感分类。【结果】使用不同的数据集进行实验,实验结果表明该方法所构建的分类器性能优于其他方法,分类准确率明显提高。特别是在已标注样本占40%的情况下,提升5%左右。【局限】在协同训练过程中使用随机特征子空间生成方法不能保证每次构建的两个分类器都是强分类器,因此未能充分地满足协同训练的假设条件。【结论】引入主动学习思想后,能够解决协同训练对低置信度样本处理的不足,进而增强分类器性能,提高分类准确率。 【Objective】 Aiming at the problem that there are not many annotated samples and fewer annotated sets in the emotional classification of Weibo, a new method is proposed. 【Method】 Based on the collaborative training algorithm, this paper introduces the idea of ​​active learning, selects the most valuable and informative samples from the low confidence samples, submits the annotations, adds them to the training set after marking, and rechecks the classifiers for affective classification . 【Result】 Different datasets were used to carry out experiments. The experimental results show that the performance of the proposed method is superior to other methods and the classification accuracy is significantly improved. In particular, 40% of the marked samples have been upgraded by about 5%. [Limitations] The use of stochastic feature subspace generation methods in collaborative training can not guarantee that each of the two classifiers constructed each time is a strong classifier, thus failing to fully satisfy the assumptions of collaborative training. 【Conclusion】 The introduction of active learning can solve the shortcomings of cooperative training on low-confidence sample processing, enhance the performance of classifiers and improve the classification accuracy.
其他文献
在外人看来,小芳和丈夫的婚姻是非常幸福的,然而谁又能想到,这幸福里竟浸透着难以言说的苦涩。新婚之后,婆婆一直鼓励他们多过夫妻生活,催他们赶快要个孩子。可小芳怀孕生子
Can women and men truly be friends? Hollywood this year has been in love with the idea of friends“with benefits,”and it seems like people have forgotten that
无论是恋爱还是结婚,找一个处处不如自己的,谁都会感觉到委屈;可若是找一个处处都比自己强的,心理上又会承受很大的压力。尤其是男生,一旦对方各方面都很强,自己便毫无优越可
由南京航空学院振动工程研究所研制的“结构振动动态设计”于1989年12月通过航空航天工业部科研成果鉴定。结构振动动态设计是目前国内外普遍关注的研究课题,是结构设计的一
下班时分,一个叫秋月的女孩闯进了我的咨询办公室,她说自己遇到了一些难题,实在解决不了,几乎走投无路了。秋月自述:我今年21岁,是大二学生。我的家乡离北京很远, When I go
目的心脏彩色多普勒超声检测丙型肝炎患者左室舒张早期快速充盈的血流(E峰),舒张晚期左房收缩的血流(A峰),E/A比值,射血分数(EF),左室舒张内径(EDD),左房内径(LA),左室后壁厚
香港一家公司展出了名为 ENComanii 的球形风扇,是由两个电动机分别驱动前后两个扇叶,使室内各个方向均可感受到阵阵凉风的吹拂。这种风扇具有调速、定时、模拟自然风等功能
我家樓下有个牙科诊所,主人是个和善的大姐,她的诊所跟惯常的不同,有书架,有很多绿植,有好看的手工布艺。我们聊天,她总会告诉我,她养的多肉又长胖了、昨天来拔牙的娃娃特别萌、广场南边有棵很漂亮的树……从不抱怨菜价又涨、路上太堵。  没有客人时,她常在店门口晒着太阳看书,恬淡悠闲。我想,她一定是内心安定的人,所以才一举一动尽显从容。仔细想,人要心安,真的也不需要什么大富大贵。有屋可居,有谋生本领傍身,没
本期导读——编者的话《中国特殊教育》1998年第1期和读者见面了。本期设5个栏目,共发表了11篇文章,其中调查研究4篇,理论研究2篇,国际特教2篇,师资培训1篇,教育教学2篇。本期重点介绍调查研究栏
本刊编委会于今年4月29日至5月1日在宁波举行了第三届二次常编会议,参加会议的常编有9人。本刊顾委张阿舟教授列席了会议。会议由本刊编委会副主任杨世超教授主持。会议开始