汉语文献文外频率加权与逆文献频率加权方法的比较

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:liutongyang123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对信息表示和信息检索中的文外频率加权和逆文献频率加权进行定量分析。以《软件学报》2004年发表的166篇计算机类的文献为测试集,通过计算机切词,统计词频,分别计算出各种语词加权方式不同的权重,并进行比较分析,得出了逆文献频率加权优于文外频率加权法,对文献频率取对数的逆文献频率加权公式优于不取对数的加权公式的结论。
其他文献
This essay examines the origin and development of micro-economics of information from the perspective of the development history of western economies. It consid
纵观全国各大媒体,特别是各级电视台,每年都会举办各种大型活动丰富电视荧屏,扩大自身影响力和知名度,由于媒体强大的威力,很多活动所产生的影响力和对人们生活的渗透力有时会超乎
浙江省建德市地处浙西山区,由于独特的高山地理环境,缺水问题历来是制约山区经济发展的主要因素,为了彻底改变这一落后局面,经多方考察论证,决定因地制宜,采取建造蓄水池的办
为了有效地评测人的驾驶精神疲劳状态,本文提出了一种基于核学习算法的精神疲劳分级方法。该方法首先用多变量自回归模型(MVAR)提取位于前额、顶叶、枕叶共6个通道的多维脑电信
人才是创新发展的动力,沈阳作为东北区域唯一的新一线城市和核心城市,近年来通过一系列政策措施在人才发展方面取得了一定效果,但受经济发展、地域环境、气候条件以及思想观
介绍了4个Z39.50虚拟联合目录的应用案例,以及最新版Z39.50标准和下一代Z39.50国际计划(ZING)的发展情况,较清楚地揭示了Z39.50的发展方向与动力.采用XML、Web服务等主流技术
本文综述了我国台湾省数字化学位论文资源建设的历史和现状,并从用户角度讨论其建设和服务的若干特点.