一种面向不完全标记的文本数据流自适应分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:crackerking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流,这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此,面向不完全标记的文本数据流提出了一种自适应的数据流分类算法。该算法以一个标记数据块作为起始数据块,对未标记数据块首先提取标记数据块与未标记数据块之间的特征集,并利用特征在两个数据块间的相似度进行概念漂移检测,最后计算未标记数据中特征的极性并对数据进行预测。实验表明了算法在分类精度上的优越性,尤其在标记信息较少和概念漂移较为频繁时。
其他文献
牛瘟是一种败血性传染病,疾病的产生与牛瘟病毒有关,急性病程特征主要表现为黏膜发生炎性坏死性变化,特别是对于消化道黏膜而言。该病在我国已经基本被消灭,但是个别地区存在
摘 要:现代社会是开放、协作的社会,口语交际能力越来越重要,我们的学生不论将来从事什么工作,都需要有一定的社会交际能力和口头表达能力。关键词:小学口语交际教学; 思考中图分类号:G623.2 文献标识码:A 文章编号:1006-3315(2015)05-071-001探索口语交际教学的高效之路,教师必须走向民主,要优化口语交际教学,实现内容的综合化、途径的多样化和方法的交际化。下面就笔者的教学实践
为了解决目前多信道接入协议面临的多信道隐藏终端和多信道Deafness问题,加入了探测报文和等待报文,采用节点状态表和信道空闲状态表的方法,并采用NS2仿真软件对该协议进行性
逻辑语言由于其表达力和灵活性,是访问控制中授权语言的基础之一。针对Datalog语言缺乏表达事务和多方决策模型的能力,对Datalog进行了扩展,提出了一种带权重谓词的可选事务
中年级是习作的起步阶段,以段的训练为主,为高年级习作奠定基础。《语文课程标准》中对中年级的习作提出要求:留心周围事物,乐于书面表达,增强习作的自信心。能不拘形式地写
随着社会经济的不断发展和城市建设步伐的加快,老旧小区消防管理工作已成为消防工作社会化进程的重要组成部分,也是提升城市火灾预防体系的重要环节。目前主要有以下问题。
本文通过对滇藏茶马古道必经之地大理的地理环境描述,结合相关的历史文献资料对滇藏茶马古道在不同的历史时期所起作用进行梳理,并且结合历史的变迁和茶马古道对经济、政治的
近年来,经济发展红利普惠中国,民众的资产规模不断扩大。不断积累的资产需要经过专业的金融机构和人员进行管理,才能实现有效的保值增值。上海少伯资产管理有限公司副总经理
摘 要:在梳理2008—2018年三峡水库综合管理的水库调度运行管理、水污染防治、生态环境保护、水库资源管理、航运管理、地质灾害防治、蓄水影响处理、应急管理、监测与科研、巡库工作与专项检查等十项管理与协调工作主要内容的基础上,归纳总结了三峡水库综合管理的主要做法和基本经验。  关键词:三峡水库;综合管理;经验;启示  中图法分类号:TV62;X321 文献标志码:A DOI:10.
综合粗糙集理论和人工神经网络的优点,提出了改进的粗糙集理论算法,并结合人工神经网络,实现了一种无线传感器网络(Wireless Sensor Network,WSN)节点智能故障诊断方法。首先