【摘 要】
:
传统半监督文本分类方法,大多数建立在词根特征的基础上,忽略了语义特征的重要性,导致分类精度不高。考虑到语义对分类的影响,本文提出融合概念与词根双特征的文本分类模型。
【基金项目】
:
重庆市自然科学基金资助项目(cstc2012jjA40002),中央高校基本科研基金资助项目(0216005207016)
论文部分内容阅读
传统半监督文本分类方法,大多数建立在词根特征的基础上,忽略了语义特征的重要性,导致分类精度不高。考虑到语义对分类的影响,本文提出融合概念与词根双特征的文本分类模型。该方法以Word Net为本体库,在Co-training框架下,构造基于概念和词根的双分类器进行协同训练的分类模型。实验分析了新模型分类准确率和召回率,结果显示新模型相对于旧模型在这2方面都有提升,表明基于概念与词根双特征互助的新算法具有更高的有效性。
其他文献
软件工作者的核心任务就是开发软件。上世纪60年代提出结构程序设计方法,解决了编程中的程序正确性问题。70年代,为了设计大型软件,提出了软件工程的设计方法,但软件工程有先天不
随着近三十多年来电视事业的快速发展,电视观众的欣赏品位也在不断提高,使得电视节目主持人这个作为节目的最终展现者、代言者随之走进千家万户,吸引了众多的眼球,由此电视节
孔子曰:“言之无文,行而不远。”说写文章应讲求文采。语言干瘪,不生动,不彤象,缺乏美感,就不能很好地表达出你的思想与情感。反之,语言生动优美的文章,使人读来如饮醇酒,久而弥笃。那
【正】 一、识别方法 本病主要为害果实。发病初期果面上产生褐色圆形水渍状小斑,以后病斑迅速扩大,从病斑中央长出灰白色至灰褐色小绒状的霉丛(病菌的孢子座),常呈同心轮纹
学生阅读文本时,是学生和文本之间的一种信息交流。在这种交流中,学生是否真正读懂文本的意思,是否真正理解文本的内容,取决于学生本身。因为“阅读是学生的个性化行为”。这种“
【正】 晋南属黄淮海流域夏大豆区,包括临汾、运城盆地,峨嵋垣地、中条山阶地及东侧沁河下游的晋城、阳城、沁水等县。该区是我省小麦、棉花的集中产区,大豆水地主要是麦茬夏
目的探讨心理护理对人工流产患者不良情绪的影响。方法选取妇产科门诊要求接受人工流产术而无禁忌证的孕妇240例,根据婚史随机分成实验组及对照组各120例。实验组进行常规护
《语文课程标准》指出:“阅读浅易文言文,能借助注释和工具书理解基本内容。”可见,对初中学生学习文言文的要求并不高。但在实际学习中,许多学生对文言文感到头痛、厌烦,老师认为
浙报传媒4月27日发布2012年年报、2013年中报业绩预告。公司预计2013年1—6月份归属于上市公司股东净利润同比增长25%以上。公司去年同期归属于上市公司股东净利润11156.08万元