论文部分内容阅读
随着数据量的增加和数据存储操作性能需求的提高,传统基于DRAM+HDD存储架构的存储系统面临着严峻的挑战。由于HDD的I/O时延过高,HDD已经成为数据存储系统的性能瓶颈。相对于HDD来说,SSD具有高带宽、低延迟的优势,通过引入SSD做为DRAM和HDD中间的缓存层,有望缓解HDD的性能瓶颈问题。但现有缓存管理策略并不能有效的发挥SSD的性能优势,数据全部经过SSD缓存会造成对SSD频繁的小粒度随机写,这不但会影响SSD的性能,同时也会缩短SSD的使用寿命。本文针对这些问题进行研究,设计了一个基于SSD的缓存管理策略(Dram Filtered SSDCache,DFSC),它旨在最大化的利用SSD的空间和性能,其主要工作和贡献如下:
1.设计了利用DRAM筛选数据来控制进入SSD的数据的算法。与传统多级缓存管理方式不同,数据直接从HDD读到DARM中,并在DRAM中观察数据的访问热度,访问热度达到阈值的数据在被替换时才会被放置在SSD缓存中。避免访问热度低的数据进入SSD造成不必要的写开销,因而它可以更有效的利用SSD缓存的性能,同时可以延长其使用寿命。
2.针对SSD的性能特点,设计了聚合写入SSD的数据和大粒度替换的方案。由于SSD上小粒度随机写的性能非常差,因此本文通过增加一个缓冲区来聚合进入SSD的数据,避免了进入SSD的数据的小粒度随机写的模式,从而使SSD的使用性能得到提高。与此相对应的,当缓存中数据满的时候,我们采取大粒度的方式替换,一次性替换一定数量的连续的页,这正与数据大粒度写入SSD的方式相对应,从而提高缓存系统的性能。
3.实现了一个基于SSD的缓存管理策略模拟平台(SCMS),它结合了真实系统和模拟器的特点,在缓存层模拟文件系统中的缓存策略,在底层则直接在SSD和HDD上完成I/O操作而非使用SSD或磁盘模拟器来完成I/O操作。在此平台上,我们进行了多种负载和配置下的性能评测。通过评测我们可以看出,相较于传统的缓存系统,我们的基于SSD的缓存管理策略DFSC缓存命中率和性能上均有明显的提升,同时在SSD上的写入量也大大降低,从而可以达到延长SSD寿命的目的。