【摘 要】
:
提出并研究了针对海量多版本文档的加权持久性top-k检索问题.加权持久性top-k检索能够返回在一个限定时间区间内与查询关键词组持续相关的k个结果,并且考虑不同时间区间有不同
【机 构】
:
清华大学计算机科学与技术系 北京 100084
【出 处】
:
中国计算机学会第一届CCF大数据学术会议
论文部分内容阅读
提出并研究了针对海量多版本文档的加权持久性top-k检索问题.加权持久性top-k检索能够返回在一个限定时间区间内与查询关键词组持续相关的k个结果,并且考虑不同时间区间有不同的权重,针对这一问题,把现有时空查询和针对多版本文档查询的方法进行扩展,使其支持加权持久性top-k检索问题,并分析总结了该方法的缺点,进而又提出了一种新的基于时间区间窗口的算法。基于时间区间窗口的算法能够支持多种经典top-k算法并有效地解决加权持久性top-k检索问题。最后使用Wzkipedia多版本数据进行了一系列性能试脸,对比浏试了基于区间窗口的算法和扩展算法。结果表明区间窗口算法在各个测试下的效率和可扩展性明显优于扩展算法.
其他文献
自从Creech等于1974年报告美国4例接触氯乙烯工人的肝血管肉瘤以来,对氯乙烯与肝脏疾病的关系,已引起广泛注意。现将国外近两年来有关资料,作一简要复习,以供参考。历史与现
铝和矽在地壳中的含量约为7.45%和26%,其氧化物含量分别居金属和非金属元素氧化物的首位。人类应用和接触铝、矽的化合物皆有悠久的历史,但是至今对于它们的相互关系仍然不
番茄使用激素技术要点陈子俊为了防止番茄落花落果,在生产上应用较多的座果激素有2,4—D和防落素两种,在使用过程中,应注意的事项要点是:1、使用浓度:2,4—D的使用浓度,一般10-20ppm;防落激素的使用浓
目的:妇产科开腹手术患者手术室护理时采用精细化护理方法防止切口感染,观察该种护理方法的效果.方法:将我院妇产科开腹手术患者作为观察对象,观察时间段为2018年2月到2020年
本文以丰南区农村公路建设为例,在分析其农村公路建设取得的成就的基础上,研究了其存在质量意识淡薄、资金缺口大、技术力量缺乏等问题,指出加强我国农村公路建设需要增强思想
目的:针对耳鼻喉科护理管理中所涉及的不安全因素加以防范并提出相关的解决对策;方法:选取2019年7月到2020年7月本课题组所在医院耳鼻喉科收治的60例患者,针对患者进行常规护
随着社会网络数据规模的急剧上升,传统的社会网络社团挖掘方法无法有效应对大数据社会网络场景.基于MapReduce并行计算框架,提出了一种针对大数据社会网络的社团挖掘方法.储
1.用含黑索金的饲料饲养大白鼠,观察其中毒12周内的一般状态、死亡率、外周血象和病理学变化,并与同浓度TNT、黑索金TNT复合中毒时的中毒效果进行比较。2.黑索金浓度为1.0和0
目的:对于个性化护理与奥美拉唑配合进行胃炎胃溃疡治疗患者在临床上的效果进行分析.方法:选择2018年10月-2019年10月入院治疗的患有胃炎胃溃疡患者共计88例,依照随机分组的
目的:围手术期护理干预方法使用在卵巢囊肿患者采用腹腔镜手术治疗的护理中,观察该种护理方法的效果.方法:将我院收治的腹腔镜治疗的卵巢囊肿患者作为观察对象,观察时间段为2