【摘 要】
:
特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优
【机 构】
:
中国石油大学(华东)计算机与通信工程学院
【基金项目】
:
中央高校基本科研业务费专项资金资助项目
论文部分内容阅读
特征提取技术是决定分类结果优良的主要因素,传统特征提取方法存在许多不足,诸如,当类别和特征分布高度不平衡时,不能有效地处理低频词;对于单个特征的处理不当,导致局部最优解的产生.针对特征提取技术中的问题,提出基于x2统计-遗传算法的特征提取算法,此方法将词条的x2统计值引入到特征向量中,将此类向量作为遗传算法的初始种群进行启发式搜索,与此同时,针对特征提取的性质,提出新的适应度函数和交叉规则.实验表明,基于x2统计-遗传算法的特征提取算法能选择出准确表征文本类别的特征项,将其运用到文本分类系统中能有效地提高文本分类的准确率.
其他文献
高层有以下特点:一是高层通过电梯的配置,使原有意义的多层住宅具有了高层的优点。高层以现浇楼板施工,建筑结构上与高层基本相同,建筑质量好。高层的房型、建筑系数又接近多层,间
本文结合实际分析了大体积混凝土由于内外温差、自身约束和外部约束共同作用产生的温度应力而形成裂缝的情况,并从原材料品质、施工、养护及监控等几方面归纳总结了大体积混凝
目前,企业普遍存在“信息孤岛”林立、数据断层的局面,造成企业信息化的程度难以满足当今日益激烈的市场竞争.为了解决企业的数据集成问题,对目前常用数据集成方法进行了分析
当前,现浇钢筋混凝土楼面板的裂缝,是目前较难克服常见的质量通病之一,,特别是住宅工程楼面出现裂缝,往往会引起很多的投诉纠纷以及索赔要求等。作者结合多年来的工作实践和相关的
电力系统随着电气化和自动化水平的提高而日益快速地从量和质两个方面在发展变化,现代高新技术也日益向其渗透交叉。文中概括描述了现代电力系统中将会带来变革性影响的前沿性
本文基于桦甸市板庙子金矿区进行了探讨,归纳、总结和提取了各种找矿信息,建立了矿区地质—地球物理—地球化学—遥感信息综合找矿标志,供大家借鉴参考。
采用搭载后的大曲,曲霉、乳酸菌等均有所增加.通过正交试验研究和模糊综合评价表明,在稀醪与酒精发酵时,活性干酵母添加量0.2%、航天大曲添加量1.2%、醋酸菌添加量0.7%,发酵温度
采用聚乙烯醇为粘结剂,对内配碳铁铌共生矿冷固结球团强度进行了研究,分别考察了球团碳氧比、成形压力、粘结剂浓度及烘干温度对干湿球强度的影响。结果表明,在碳氧比1.0、成
给排水系统作为住宅设备的重要组成部分,其系统设计是否合理,对今后住户的装修、日常使用产生重要影响。文章简要分析了影响建筑给排水设计的相关因素,基于实践经验,从给水设计、
针对于中国城市私房建设出现的生活环境质量差,污染严重,浪费土地资源,杂乱矮劣;忽略城市整体规划建设,造成重复建设,功能不齐全,影响了城市总体规划和城市综合中心等功能的问题,提出