在大数据环境下设计和实现快速读写的算法和数据结构

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户：xieke594112

【摘要】

：

　　设计和实现数据处理中的核心算法的一个目标如下：对于一个给定的数据存储格式,以低成本的代价快速地执行读和写的操作。在大数据的环境下,我们重新评估了几个常用的算法和

【作者】

：

张晓东

【机构】

：

美国俄亥俄州立大学

【出处】

：

第三届CCF大数据学术会议

【发表日期】

：

2015年10期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　设计和实现数据处理中的核心算法的一个目标如下：对于一个给定的数据存储格式,以低成本的代价快速地执行读和写的操作。在大数据的环境下,我们重新评估了几个常用的算法和数据结构,其中包括B+tree,LSM-tree,Key-Value Store,以及存储关系数据表的基本格式。我们发现这些长期使用的算法和数据结构在大数据的处理过程中暴露出了一些硬伤。针对这些问题,我将报告三个信的研发结果：(1)为了恢复在主存的缓存区内的局部性和对它访问的高命中率,我们重构了LSM-tree,从而使读和写在大数据环境中都可以有效和快速地执行。(2)在分布式的机群的环境下有效地划分和存储关系表从而达到平衡网络数据传输和本地磁盘的读写的目的。(3)通过GPU来极大地提高Key-Value Store的吞吐量。这些研发工作的有关算法和软件都是开源的,有些结果已经被生产运行系统所使用。

其他文献

单颗粒示踪技术研究宿主细胞自噬参与的流感病毒早期侵染过程

会议

单颗粒示踪技术宿主细胞自噬流感病毒

RBM24通过与HBV pgRNA相互作用调控病毒基因表达、转录和复制

会议

HBV相互作用调控病毒基因表达转录

用微孔滤膜评价交联聚合物溶液的封堵性能

交联聚合物溶液(LinkedPolymerSolution,LPS)是一种新型的深部调剖剂.交联聚合物溶液的评价方法应与一般评价高浓度交联体系的方法有所不同.该文提出一种新的快速有效的评价

学位

部分水解聚丙烯酰胺柠檬酸铝深部调剖微孔滤膜粒度分析交联聚合物溶液油藏微孔介质封堵性能

EGR1 Facilitates EV71 Replication by Direct Binding to the Viral Genome RNA