存储系统双缓冲设计模式

前言


在存储系统写数据的过程中,出于性能上的考虑,新写的数据并不是每次都flush到目标存储中的,而是先放入到一个buffer空间里,等到buffer空间满了,再做一次flush出去的动作。这种情况和人们等车的例子极为类似,一辆车等人都上满了再开,才能保证更高的效率。但是这种缓冲设计模式还是存有一个主要弊端的,当缓冲数据满后将会阻塞住后面的数据操作直到缓冲数据完全flush出去。更简单的来说,这里会有个throughput的问题。那么有什么改进办法呢,答案是利用另外一个缓冲构成双缓冲模式。本文笔者来聊聊双缓冲的模式设计。

单缓冲模式


我们先来回顾下单缓冲的工作模式,工作原理上面已经提到过了,如下图所示。
在这里插入图片描述

单缓冲模式改进: 双缓冲模式


双缓冲比较学术的称谓叫做DoubleBuffer。这个有个大家可能理解的误区:双缓冲就是单缓冲在size空间上的的double。如果是这这种模式,throughput问题依然存在。

如果说增大缓冲区长度属于纵向扩展的话,那么这里所说的双缓冲则是横向上的扩展。

它的运作原理如下:
‌将缓冲区分为2份,1份为当前缓冲区buf current,另外1份为预写入分区buf ready,两个缓冲区空间大小一致。current区负责当前的写操作存放,当我们达到缓冲处罚条件时,执行一次双缓冲的调换操作。然后由另外的程序执行ready区的flush操作。被交换变为空缓冲区的current区重新用于这的数据写入。

‌以上的执行模式有以下2大优势:
‌1)程序无需反复进行创建新缓冲的操作
‌2)程序的写请求不会被阻塞住,除非current缓冲区已经满了同时ready缓冲区数据还没有全部flush出去

在使用双缓冲区模式时,因为缓冲区是可能存在concurrent使用的情况,所以这里需要有thread safe的处理,以此保证每个操作是原子的更新。比如双缓冲在swap的时候就不应该发生add缓冲的动作,再比如还应该有一个线程可先性的变量来告诉程序,ready缓冲区是否已完全flush出去。

同样地,笔者简单构建了双缓冲区的流程图,如下所示:

在这里插入图片描述
双缓冲设计在一些存储系统中有所应用,大家可以阅读相关系统代码进行细节上的阅读,比如HDFS里的EditsDoubleBuffer类。

原文地址:https://www.cnblogs.com/bianqi/p/12183541.html