【摘 要】
:
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:
【机 构】
:
复旦大学计算机与信息技术系,福州大学数学与计算机科学学院
论文部分内容阅读
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出现与否,从而忽视了出现频度;另一方面,当产生的规则数量较多时,为提高分类效率需要进行规则修剪,修剪后的分类准确性明显降低.为此,提出了基于分类规则树的带词频的频繁模式文本分类方法.研究结果表明,词频的引入可以提高关联分类的准确率;而采用分类规则树可使分类时间明显加快又确保不降低分类质量.这
其他文献
目的:探讨多西他赛单药或联合顺铂在分子靶向治疗失败的非小细胞肺癌中治疗疗效和安全性。方法32例非小细胞肺癌患者,曾接受过分子靶向治疗(吉非替尼或厄洛替尼),靶向治疗后出现疾
现如今计算机的发展已经逐渐摆脱单机的运行模式,取而代之的是更加强调协调、共享的计算机网络模式。计算机网络从一开始的Arpanet逐步发展到今天功能更加强大的"云"网络。伴随
完善的园林安全规章制度是每个园林景点能够正常开放的保障,这对于国家级文物保护单位——瞻园尤其重要。笔者通过对瞻园安全管理情况的调查及分析后,发现该古典园林景点在园
患者,男,73岁,教师,因“反复咳嗽、咳痰7年余,加重伴胸闷10天”于2015-01—13入住我院。患者7年前受凉后出现咳嗽,咳白色黏痰,偶有轻度胸闷、喘憋,受凉后可加重,自服药物(具体不详)后症
辫子群是一种新兴的适用于量子计算机时代的公钥密码平台,辫子群上已知的用于公钥密码系统的一些难解问题和基于这些难解问题的公钥加密算法都受到不同程度的攻击.辫子群上公
QC小组活动是企业职工参加现场质量管理的核心。开展QC小组活动有利于企业提高工作质量、服务质量,提高企业市场竞争力。本文从三个方面简要论述了搞好企业QC小组活动管理的
运用机器学习中新颖的核方法和社会网络中广泛存在的小世界现象,对Hattori等人提出的多模块多对多联想记忆模型(multi-module associative memory for many-to-many associatio
广告创意是根据广告主题和消费者心理所进行的创造性构思活动。成功的广告是依据消费者心理规律策划出来的.它对消费者一般具有六种影响力。广告创意的表现手法有很多种,代言人
目的:从TGF-α、TGF-β配体成员( TGF-β1、TGF-β2、TGF-β3)、TIMP-1、TIMP-2、MMP-2筛选在非小细胞肺癌( NSCLC)中mRNA水平异常表达的细胞因子,并探讨其临床意义。方法实时定量