基于潜在语义索引的文本特征词权重计算方法

来源 :计算机应用 | 被引量 : 41次 | 上传用户:playallprogram
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"Sigmiod函数"和"位置因子"的新权重方案。突出了文本中不同特征词的重要程度,更有利于潜在语义空间的构造。通过实验平台"中文潜在语义索引分析系统"的测试结果表明,该权重方法更利于基于潜在语义的检索性能的提高。
其他文献
针对H.264/AVC经典流控算法JVT-G012对运动剧烈图像流控效率的不足,提出了一种基于图像运动剧烈程度的流控算法。对运动剧烈的图像,在同一复杂度区域内,用前一帧实际编码码率与目标码率的差值调整当前帧目标码率,并且编码时利用最小率失真模式的原始帧和重建帧的SAD估计MAD值,根据二次模型估计量化参数优化拉格朗日参数。仿真试验证明与JVT-G012以及Jiang等对H.264AVC的改进的码率
国家教育发展规划中提出:“到2020年,中国将基本实现教育现代化,跻身人力资源强国“,教育信息化是实现教育现代化的基础和条件,以教育信息化带动教育现代化是当今世界教育改革和发
作者根据《中国减灾》所载1990~1994年月灾情记录,经统一编码和标准化处理,建立了以行政县为基本单元的数据库,进而对近五年来中国自然灾害空间分布及其月动态变化进行分析,并与1949~1990年中国自然
在实际中接收天线与辐射源之间通常存在相对运动,此时传统的高分辨算法性能将严重下降,针对上述问题提出一种自适应信号波达方向即DOA估计算法。新算法以快速稳定的信号子空间跟踪算法为基础,结合ESPRIT算法实现DOA估计,不需要特征值分解,计算复杂度小。仿真实验显示新算法比基于幂迭代的动目标DOA估计算法具有更好的估计性能。
我自与海粟大师黄山邂逅,至今已有四十年整。回顾老先生长期来对我的关怀爱护,指导与帮助,真恩重如山。恩师对我一生的生活艺术道路有着直接的很大影响。 每次同海粟大师接
一、活动意义 “体验创新乐趣,协作解决问题,承受竞争压力,分享得失经验” 教育在培养民族创新精神和培育创造性人才方面,肩负着特殊的使命,创新能力、创新思维是学生学习的目的之
实验教学作为实践教育的主要组成部分之一,对培养学生实践能力、创新思维,提高学生的综合素质有着不可替代的作用。本文针对传统电子信息类实验教学中存在的问题,分析了将基于VR
以教师教学信息管理系统为例,讨论了如何使用Access快速创建数据库应用系统。
本文论述了在高校实验室队伍建设中设备维修人员所占的重要地位,应引起各高校领导的高度重视。
本文从分析大学计算机基础课程的目的和要求出发,提出了在教学当中存在的几个问题,并逐一给出了解决方法。