基于模糊粗糙集的Web文本分类

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:fakemario
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络信息的多样性和多变性给信息的管理和过滤带来极大困难,为加快网络信息的分类速度和分类精度,提出了一种基于模糊粗糙集的Web文本分类方法。采用机器学习的方法:在训练阶段,首先对Web文本信息预处理,用向量空间模型表示文本,生成初始特征属性空间,并进行权值计算;然后用模糊粗糙集算法来进行信息过滤,用基于模糊粗糙集的属性约简算法生成分类规则;最后利用知识库进行文档分类。在测试阶段,对未经预处理的文本直接进行关键属性匹配,经模糊粗糙因子加权后,用空间距离法分类。通过试验比较,该方法具有较好的分类效果。
其他文献
幼儿时期是孩子语言能力发展的重要时期,绘本教学可以通过图像、文字等形式多角度开发儿童智力,激发孩子的学习兴趣,对培养孩子的创造能力、表达能力和想象能力都有很重要的
根据专家知识从奶牛图象中提取了描述奶牛体强的12个特征参数;设计了一个三层前向神经网络,选择了一组奶牛图象训练样本。网络训练试验表明,本网络收敛性好且学习次数少;对现场采集的10头奶牛图象进行奶牛体强判别,判别结果和人工评定的结果基本一致;对全部输人特征参数进行了主变量分析,给出了采用不同数量特征参数的优化组合方案。作者认为神经网络可以取代人工评定奶牛体强。
期刊
随着信息技术时代的到来,教学课程改革面临技术革新的难题,如何将学科教育与信息技术进行有效融合成为教师思考的难题之一。信息技术的应用可以帮助丰富教学资源,改善课堂学
在中国语境下理解“诗与公众世界”的关系,需要从中国新诗出现的思想史背景谈起。关于诗歌的本质属性问题,历史上有两个主流说法,一是强调伦理层面的“言志”说,二是着重情感层面
我一直喜欢画风景写生,过去很大程度上是为了提高写生技巧,以为只要技巧提高了艺术也会随着提高,结果事与愿违。  写生画多了我就一直在思考,自然景物的千奇百怪的变化会引起我们的联想,触动我们敏感的神经,这些来自风景或人物以及我们周边的所有的图像都是可以写生的题材。写生的难度在于找到真正具有“陌生感”的绘画意味,我们在异地很容易将风景画的更生动,而从身边的景色中要找到陌生感就不那么容易了!它需要你有超乎
语文课程是小学课程的重要组成部分,语文课堂是培养学生创新思维的理想场所之一。但在传统的语文教学中,教师注重教授课本上的语文知识,对学生的创新能力锻炼未能有效重视。近年
特征选择可以选出最有利于分类的特征,加快算法的运行速度,消除冗余,提高分类准确率。文中提出了一种基于遗传算法的特征选择方法。在遗传算法中结合支持向量机和分类权值的
本文引入了一种梯形邻接图的图形表示方法来表达工程图纸中的线图形及其几何拓扑关系,并在此基础上提出了一种基于单次逐行扫描、梯形轮廓匹配、从轮廓提取矢量的工程图纸矢量化算法。这种算法能有效地提取出与原图保持较好一致性的图形矢量,具有处理速度快、内存需求小、矢量化效果好、特别适合丁大幅面图纸的矢量化等特点。