在大数据环境下设计和实现快速读写的算法和数据结构

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:xieke594112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  设计和实现数据处理中的核心算法的一个目标如下:对于一个给定的数据存储格式,以低成本的代价快速地执行读和写的操作。在大数据的环境下,我们重新评估了几个常用的算法和数据结构,其中包括B+tree,LSM-tree,Key-Value Store,以及存储关系数据表的基本格式。我们发现这些长期使用的算法和数据结构在大数据的处理过程中暴露出了一些硬伤。针对这些问题,我将报告三个信的研发结果:(1)为了恢复在主存的缓存区内的局部性和对它访问的高命中率,我们重构了LSM-tree,从而使读和写在大数据环境中都可以有效和快速地执行。(2)在分布式的机群的环境下有效地划分和存储关系表从而达到平衡网络数据传输和本地磁盘的读写的目的。(3)通过GPU来极大地提高Key-Value Store的吞吐量。这些研发工作的有关算法和软件都是开源的,有些结果已经被生产运行系统所使用。
其他文献
交联聚合物溶液(LinkedPolymerSolution,LPS)是一种新型的深部调剖剂.交联聚合物溶液的评价方法应与一般评价高浓度交联体系的方法有所不同.该文提出一种新的快速有效的评价
会议
会议
许培武先生发起的“中国风景”群展终于迎来第三回。这一次,我们引入了彩色摄影,这也是蓄谋已久的。同时一如往届,我们也没定下一个主题。放下了也就开阔了,无主题,也就全面
该文采用反相高效液相色谱法,首次建立了国产百合科剑叶血竭(Dracaena cochinchinensis(Lour.).S.C.Chen)和进口棕榈科麒麟血竭的HPLC指纹图谱,并运用相对保留指纹谱的方法,将HPL
会议
天然气水合物的水合/解合过程中一多组分多相共存与转变的复杂热流体系反应动力学过程,而准确预测气体水合物生成条件则是水合物状态下储运和分离技术实用化之关键.该文对气
会议