最大熵方法中特征选择算法的改进与纠错排歧

来源 :北京理工大学学报 | 被引量 : 0次 | 上传用户:jwpvinson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对应用最大熵原理建立语言模型的特征选取方法作了改进.用特征模板从训练样本中获得候选特征集,应用频次与平均互信息相结合的方法从候选特征集中选取特征.在选择有效特征时,对候选特征集中出现频次大于某一限值的特征或平均互信息很大的特征直接加入有效特征集,且不是每选一个特征都调用参数的求解过程,从而加快了特征选择的速度.将改进的算法应用于文本纠错建议的排歧,实验证明,所改进的特征选择算法有效.
其他文献
目的 探讨短暂性脑缺血发作(TIA)患者行颈动脉支架置入术(CAS)前后白介素-6(IL-6)、肿瘤坏死因子-α(TNF-α)、C反应蛋白(CRP)的水平变化及其与再狭窄的关系.方法 根据病变情
1 病例介绍1.1 病例资料 患者,女,30岁,2周前无明显诱因出现颜面浮肿,双膝关节间歇性酸痛,并出现胸闷、干咳,无颜面皮疹、无脱发及光过敏史,于2010-02-18收住本院肾内科.
目的 探讨腹腔镜胃癌D2根治术的可行性及其疗效.方法 2007年1月至2009年3月,对529例胃癌患者施行胃癌D2根治术,其中腹腔镜手术患者(腹腔镜组)218例,开腹手术患者(开腹组)311
目的 探讨红细胞生成素(EPO)是否可以抑制高糖诱导的大鼠近端肾小管上皮细胞凋亡及其相关机制.方法 传代培养大鼠近端肾小管上皮细胞(NRK-52E),分为正常对照组(NC组)、渗透浓
诺瓦克病毒(Norwalk virus,NV)和诺瓦克样病毒(Norwalk-like viruses,NLV)是一组世界范围内引起的急性无菌性胃肠炎的重要病原.NV是一组形态相似、核苷酸同源性较高、抗原性
患者,男,69岁,因右鼻腔反复出血4个月入院。体检:全身浅表淋巴结未见肿大,鼻中隔左偏,右鼻腔中鼻道可见一新生物,表面有结痂,伴脓性分泌物。鼻窦CT:右侧筛窦内可见软组织肿块
目的 比较终末期肝病模型(MELD)评分、Child-Turcotte-Pugh(CTP)评分、Mayo评分、MESO指数和MELD-Na评分系统预测慢性重型肝炎患者预后的价值.方法 回顾性分析温州医学院附属
目的:探讨Caspase-3和Bcl-2蛋白在膀胱移行细胞癌中的表达及其与病理分级和临床分期的关系。方法:采用免疫组化SABC法并结合图像分析方法检测32例膀胱移行细胞癌和10例膀胱正
目的 探讨哮喘小鼠TGF-β/Smad信号通路表达及布地奈德(BUD)对其的影响.方法 昆明小鼠随机分为哮喘模型组(A 组)、治疗对照组(B组)、BUD治疗组(C组)和正常对照组(D组).A组以
目的 观察痰热清注射液联合黄芪注射液对急性呼吸窘迫综合征(ARDS)患者肺功能的影响,并分析它们的作用机制.方法 选择ARDS患者62例,按随机原则分为常规机械通气对照组31例,机