论文部分内容阅读
CloudBurst是在MapReduce框架下实现的一种并行的序列匹配算法,旨在更快地处理由下一代DNA测序仪得到的大量的序列数据在参考基因序列上的匹配问题.然而,受限于开源的Hadoop实现框架,CloudBurst未能很好地解决负载平衡的问题,也无法在Map的同时开始Reduce的工作,造成计算资源的浪费.为此,提出了一个新的分布式短序列匹配系统D-RMAP,可以很好地解决CloudBurst的这2个问题.