一种χ2统计-遗传算法的特征提取技术研究

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户：zibzibzib

【摘要】

：

特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优

【作者】

：

李华昱刘亚南欧阳纯萍

【机构】

：

中国石油大学(华东)计算机与通信工程学院,

【出处】

：

微型电脑应用

【发表日期】

：

2012年02期

【关键词】

：

特征提取技术特征提取算法文本分类特征提取统计方法遗传算法文本类别文本特征项启发式搜索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优解的产生。针对特征提取技术中的问题,提出基于χ2统计-遗传算法的特征提取算法,此方法将词条的χ2统计值引入到特征向量中,将此类向量作为遗传算法的初始种群进行启发式搜索,与此同时,针对特征提取的性质,提出新的适应度函数和交叉规则。实验表明,基于χ2统计-遗传算法的特征提取算法能选择出准确表征文本类别的特征项,将其运用到文本分类系统中能有效地提高文本分类的准确率。 The feature extraction technique is the main factor that determines the good classification results. There are many deficiencies in the traditional feature extraction methods, such as low frequency words can not be effectively processed when the classification and feature distribution are highly imbalanced; for the improper handling of individual features, Solution of the production. Aiming at the problems in feature extraction, a feature extraction algorithm based on χ2 statistics-genetic algorithm was proposed. This method introduced χ2 statistic of entry into eigenvector, heuristic search was used as initial population of genetic algorithm, At the same time, according to the nature of feature extraction, a new fitness function and crossover rule are proposed. Experiments show that the feature extraction algorithm based on χ2 statistic-genetic algorithm can select the feature item that accurately characterizes the text category, and can effectively improve the accuracy of the text classification by applying it to the text classification system.

其他文献

翻转课堂在高中信息技术教学中的实践分析

在新教学改革理念下,各种高效的、创新的教学模式如雨后春笋般破土而出,例如翻转课堂教学模式.翻转课堂教学模式通过充分突出学生的教学主体位置以及充分发挥学生的教学主体

期刊

翻转课堂高中信息技术实践策略

小学数学教学中数学模型思想的渗透研究

数学是培养学生思维能力的一门重要学科,对于学生的综合学习能力要求较高.数学模型思想可以提高学生对数学课堂的积极性,帮助学生更快地融入到课堂中,更好地理解课程内容,帮

期刊

小学数学数学模型思想渗透研究

小小发明献奥运

皓阳擅长电脑、足球和发明。在父母眼里，他是个可爱却调皮成性的孩子；在老师眼里，他是个聪明好学却有些难以调理的学生。不过，这个思维极其活跃的小男孩，是位小小“发明家”。最近他正在为2008北京奥运会的竞走运动员，开发一个竞走辅助器，只要运动员穿上装了辅助器的运动鞋，裁判就能有效地判断运动员，是否因双脚腾空而犯规……　　　　小主角：余皓阳；年龄：12岁；就读学校：中山市石岐中心小学；擅长才艺：发明创造

期刊

发明竞走运动员辅助器运动鞋奥运会足球学生思维男孩开发父母电脑裁判北京

我是妞妞——智擒匪徒

期刊

幸福无间“到”

提示语：少年有烦恼，幸福无间“到”　　　　读者来信一　　编辑老师：　　我是一名农村学校的学生，我所在的班好像在全年级中排名也很后，为此，本学期换了好几个老师，说是学校最优秀的老师被派到了我们班，可我却很不爽。这几位老师一开口就是：“你们真的很差！”听到这样的话，我的自信心完全垮了，我对学习的兴趣也彻底没了。老师，我还能重新找到过去的感觉吗？我都快要崩溃了！　　快崩溃的小叶　　　　小叶：　　别灰心！

期刊

学校读者来信自信心学习学生兴趣农村

浅谈“翻转课堂”下的少先队活动

摘要：翻转课堂的教学模式是课堂教学改革的一大焦点。那么少先队活动课如何学习借鉴“翻转课堂”的教育理念，实现因地制宜，有效实施？本文就关于“翻转课堂”下的少先队活动进行了论述。　　关键词：翻转课堂；少先队活动；教师；学生　　中图分类号：G632.0文献标识码：A文章编号：1992-7711（2020）05-0127　　当前，“翻转课堂”的教育理念逐步深入学校的课堂教学。作为学校的少先队工作，也感受到

期刊

翻转课堂少先队活动教师学生

活的礼物

期刊

恒达公司薪酬体系再设计

本文介绍了恒达公司目前的人力资源管理概况,概述了恒达公司的基本状况和我国市政建设行业薪酬分配模式。作者采用问卷调查的方法,了解从中层以上干部、一般管理人员、专业技术人员到工人四类人员对恒达公司现有薪酬制度的满意度,剖析现行薪酬管理存在的问题。本文采用海氏职位评价法进行工作分析和岗位评价,以此确定职位价值的相对排序,与市场薪酬调查相结合,建立起公司薪酬结构线,使得薪酬体系的设计更加合理及科学。并通过

学位

人力资源管理薪酬管理市政企业改制

一种砼湿喷机组的液压系统

砼湿喷机组是进行喷射全湿式混凝土的设备。该设备由主机和辅机组成 ,其主机采用双罐并列的结构。为实现并列双罐交替连续作业 ,该设备配有按设定动作顺序动作的9个职能机构

期刊

液压系统湿喷油缸阀盖职能机构回油箱顺序动作动作顺序齿轮泵执行元件

智能矿井生产记录仪的研制

In view of requirements of production of coal mine, production recording instrument in intelligent pit was developed. It can record the key data such as the amo

期刊

数据存储器电流互感器累积时间电压浪涌打印模块软件设计实时查询串行通讯主井测控系统

一种χ2统计-遗传算法的特征提取技术研究

其他学术论文