一种面向不完全标记的文本数据流自适应分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户：crackerking

【摘要】

：

现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流，这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此，面向不完全标记的文本数

【作者】

：

张玉红陈伟胡学钢

【机构】

：

合肥工业大学计算机与信息学院

【出处】

：

计算机科学

【发表日期】

：

2016年12期

【关键词】

：

不完全标记自适应数据流概念漂移 Incomplete labeled Self-adaptation Data stream Concept drift

【基金项目】

：

本文受教育部创新团队（IRT13059）,国家自然科学基金（61305063,61273292）,博士点项目基金（20130111110011）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现实生活中网络监控、网络评论以及微博等应用领域涌现了大量文本数据流，这些数据的不完全标记和频繁概念漂移给已有的数据流分类方法带来了挑战。为此，面向不完全标记的文本数据流提出了一种自适应的数据流分类算法。该算法以一个标记数据块作为起始数据块，对未标记数据块首先提取标记数据块与未标记数据块之间的特征集，并利用特征在两个数据块间的相似度进行概念漂移检测，最后计算未标记数据中特征的极性并对数据进行预测。实验表明了算法在分类精度上的优越性，尤其在标记信息较少和概念漂移较为频繁时。

其他文献

牛瘟的诊断、防控、治疗

牛瘟是一种败血性传染病,疾病的产生与牛瘟病毒有关,急性病程特征主要表现为黏膜发生炎性坏死性变化,特别是对于消化道黏膜而言。该病在我国已经基本被消灭,但是个别地区存在

期刊

牛瘟诊断防控治疗

小学口语交际教学的一点思考

摘要：现代社会是开放、协作的社会，口语交际能力越来越重要，我们的学生不论将来从事什么工作，都需要有一定的社会交际能力和口头表达能力。关键词：小学口语交际教学；思考中图分类号：G623.2 文献标识码：A 文章编号：1006-3315（2015）05-071-001探索口语交际教学的高效之路，教师必须走向民主，要优化口语交际教学，实现内容的综合化、途径的多样化和方法的交际化。下面就笔者的教学实践

期刊

小学口语交际教学思考

基于Ad Hoc的改进型多信道接入协议研究

为了解决目前多信道接入协议面临的多信道隐藏终端和多信道Deafness问题,加入了探测报文和等待报文,采用节点状态表和信道空闲状态表的方法,并采用NS2仿真软件对该协议进行性

期刊

多信道接入协议吞吐量延迟Multi-channel Access protocol Throughput Delay

带权重谓词的可选事务逻辑及其访问控制应用

逻辑语言由于其表达力和灵活性,是访问控制中授权语言的基础之一。针对Datalog语言缺乏表达事务和多方决策模型的能力,对Datalog进行了扩展,提出了一种带权重谓词的可选事务

期刊

可选事务逻辑权重谓词WT-LogicDATALOG授权语言Optional transaction logic Weighted predicate

多渠道指导,激活学生习作源头

中年级是习作的起步阶段,以段的训练为主,为高年级习作奠定基础。《语文课程标准》中对中年级的习作提出要求:留心周围事物,乐于书面表达,增强习作的自信心。能不拘形式地写

期刊

学生习作不拘形式书面表达千人一面周围事物写作素材写作兴趣阅读教学课外书籍伙伴们

论老旧小区消防安全存在的问题与对策分析

随着社会经济的不断发展和城市建设步伐的加快,老旧小区消防管理工作已成为消防工作社会化进程的重要组成部分,也是提升城市火灾预防体系的重要环节。目前主要有以下问题。

期刊

老旧小区消防安全

大理在茶马古道上的作用与影响

本文通过对滇藏茶马古道必经之地大理的地理环境描述,结合相关的历史文献资料对滇藏茶马古道在不同的历史时期所起作用进行梳理,并且结合历史的变迁和茶马古道对经济、政治的

期刊

滇藏茶马古道大理美丽中国

创新算法交易技术,推动资管行业发展

近年来,经济发展红利普惠中国,民众的资产规模不断扩大。不断积累的资产需要经过专业的金融机构和人员进行管理,才能实现有效的保值增值。上海少伯资产管理有限公司副总经理

期刊

技术创新交易系统技术专家智能算法金融机构资产规模资产管理风险管理系统

三峡水库试验性蓄水期综合管理的总结及思考

摘要：在梳理2008—2018年三峡水库综合管理的水库调度运行管理、水污染防治、生态环境保护、水库资源管理、航运管理、地质灾害防治、蓄水影响处理、应急管理、监测与科研、巡库工作与专项检查等十项管理与协调工作主要内容的基础上，归纳总结了三峡水库综合管理的主要做法和基本经验。　　关键词：三峡水库;综合管理;经验;启示　　中图法分类号：TV62;X321 文献标志码：A DOI：10.

期刊

三峡水库综合管理经验启示Three Gorges Reservoirintegrated managementexperienceinspirat

基于改进的粗糙集和神经网络的WSN故障诊断

综合粗糙集理论和人工神经网络的优点,提出了改进的粗糙集理论算法,并结合人工神经网络,实现了一种无线传感器网络(Wireless Sensor Network,WSN)节点智能故障诊断方法。首先

期刊

故障诊断粗糙集归纳属性约简算法径向基函数人工神经网络无线传感器网络Fault diagnosisRough setInductive att

一种面向不完全标记的文本数据流自适应分类方法

其他学术论文