【摘 要】
:
为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查
论文部分内容阅读
为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(LSI)方法分别求其共现词汇,并以相同的评分策略改变原始排序结果.Discounted cumulative gain(DCG)评估结果表明,本算法获得的共现词在99%的置信度下对原始排序的相关性有改进;而LSI方法获得的共现词对排序相关性也表现出同样显著的改进效果.结果显示共现词汇能改进检索系统结果排序的相关性,并且不依赖于特定算法.
其他文献
睡眠是一种神经系统活动的过程,它由大脑产生并在其支配下完成,对大脑正常功能的维持具有重要作用.脑部损伤及其治疗均不可避免地伤及脑组织,从而引起神经功能障碍~([1]),其
2011年12月24日,农业部第二届“托普仪器”杯羽毛球俱乐部邀请赛在北京贝特羽毛球馆隆重举行。本次活动由全国农技中心羽毛球俱乐部主办、浙江托普仪器有限公司全程赞助承办
盗毒蛾属鳞翅目毒蛾科,俗名桑毒蛾、黄尾毒蛾、金毛虫等,是果树、林木上一个主要食叶害虫,寄主植物有苹果、梨、桃、杏、李、樱桃、柿及杨树、柳树、榆树等。2005年本县开始
经中国合格评定国家认可委员会(CNAS)组织专家组现场评审和评定批准,东莞市保得生物工程有限公司微生物学实验室于2011年12月15日获得国家认可委颁发的认可证书,这是继荣获广东
在豆科树木中,无论是原产我国的国槐还是原产美国的刺槐,均开白色花或黄白色花,是槐花蜜的重要来源。如今园林中有两种开红花的槐械即红花刺槐与江南槐,正在逐步推广应用。
一、活动的设计思路这是一次以保护吉林市松花江野鸭子为主题的综合实践活动,也是我校作为国家级绿色学校开展环境教育校本科研主题下的子课题之一。这一主题系列活动的开展,力
为了正确引导农民选用优良品种和先进技术,提高农民种养水平,2011年11月上旬四川省农业厅组织专家组对2012年四川省农业主导品种和主推技术进行了推荐评审。蚕桑品种方面,“川山
报道了利用非线性光纤环形镜(NOLM)锁模运行的掺Yb3+光纤激光器的实验研究.获得了脉冲宽度234 ps,中心波长1053 nm的锁模脉冲激光输出,光谱带宽6 nm,输出功率2.05 mW,重复频
利用硅双基区晶体管(DUBAT)产生负阻的原理,针对HBT器件结构和MBE材料结构的特点,设计并研制出一种基区刻断结构的负阻型HBT(NDRHBT).经过特性和参数测试,证明此种NDRHBT具有
矩阵特征分解算法中紧缩近似投影子空间跟踪(PASTd)算法在自适应阵波束形成中得到了广泛应用.在对其仿真中发现仅在信噪比较低时该算法才能得到较好的结果.针对这一缺陷,正交