转：分布式视频编码

昨天老板发了个IEEE的special issue proposals,里面有个专栏是关distributed video coding的。上网查了下,发现国内也有部分人在做这个,但基本没有出什么成果。感觉这个领域还是大有可为的。从我个人来说，如果以后不搞学术而是出去外面公司做，必然要侧重于工程应用，因此彩色图像处理/视频编码等应该是下一阶段工作的重点。

分布式视频编码

1 引言

国际标准化组织(ISO/IEC)和国际电信联盟(ITU-T)这两个标准化组织分别领导和制定了两个视频压缩编码的系列国际标准；MPEG系列和H. 26x系列，它们被广泛应用于视频压缩各个领域。这些视频编码技术基于混合编码框架，编码运用运动估计，充分挖掘视频信号的冗余信息，通常情况下，编码复杂度是解码复杂度的5-10倍。非常适合于视频信号一次(一个)编码而多次(多个)解码的应用场合如：视频广播、视频点播、视频光盘存储等。然而一些视频应用场合恰恰相反，它们需要低复杂度的编码器，在解码端可以具有较高复杂度的解码器，比如计算能力、内存容量、耗电量都受限的无线视频终端：无线视频监控、无线PC相机、移动视频电话等。尤其是在尤线传感网络中，视频传感节点(VSN，Video Sensor Node)有两个基本要求：(1)要求编码器功耗低、复杂度低；(2)由于速率限制，要求编码器具有较高的压缩效率UJ。传统的视频编码技术不再适用于上述应用场合，必须寻找到新的视频压缩技术。针对这些情况，一种新的视频编码框架—分布式视频编码(DVC，Distributed Video Coding)开始受到关注，这种视频编码具有编码简单，解码较复杂，并且能够实现较为高效的压缩，抗误码特性好的特点。分布式视频编码的思想最早分别由Slepian和Wolf，Wyner和Ziv以信息编码理论的方式提出。并且加以论证，而分布式视频编码的实现算法从2002年开始有学者进行相关领域的研究，并逐渐引起关注。目前国内很少有分布式视频编码的相关文献。

本文在对目前分布式视频编码的文献进行分析和综合的基础上，首先阐述了分布式视频编码的基本原理和应川背景.然后简要介绍了几种典型的分布式视频编码算法，接着给出两种典型的分布式编码的仿真结果及分析，最后总结了目前分布式视频编码的存在问题及研究展望。

2分布式视频编码的理论基础和应用背景

2. 1 分布式编码的基本原理

多信源的编解码方式如图1所示，可以简单分为两类：(1)信源端联合编码，解码端联合解码；(2)信源端独立编码，解码端联合解码。

（a）X和Y联合编解码

（b）X和Y分布式编解码：独立编码，联合解码

图1 传统的编解码和分布式编解码示意图

2. 2 分布式视颇编码的应用背景及研究现状

总体而言，分布式视频编码有4个主要特点：(1)低复杂度的编码、高复杂度的解码；(2)对于容易产生误码的通信网络(如无线通信)，它具有较好的鲁棒性；(3)具有较高的压缩效率；(4)易形成分级编码的码流。因此分布式视频编码较为适用于需要编码复杂度较低的无线视频场合。在这些应用中，分布式视频编码有自己独到的优点：它的编码复杂度相当于帧内编码，远小于帧间预测编码，能够把复杂的计算“搬移”到解码端。对于点对点的移动视频通信，可以通过在基站或者网络节点中设置码流转换器。这样无线视频终端既有较为简单的编码(分布式视频编码)，并且还可以有较为简单的解码（H.26x，MPEG ）。

目前关于分布式视频编码的研究刚刚开始起步，主要的编解码算法有：Bernd Girod等提出的Wyner-Ziv视频编码；Ramchandran等提出的PRISM ( Power-efficient Robust high-compression Syndrome-base Multimedia)视频编码；Zixiang Xiong提出的分级Wyner-Ziv视频编码；基于小波编码的分布式视频编码方案；Sehgal等提出的“state-free”分布式视频编码方案。这些分布式视频编码都是在编码端，把各帧图像看成“独立信源”，各帧之间进行独立编码，编码方式类似于传统的帧内编码。在解码端，利用时域相邻帧的高度相关性，通过对已解码重建顿运动估计，进行时域内插求取边信息，最后边信息用于Slepian-Wolf解码和当前解码帧的重构。由于在分布式视频编码系统中的解码端，需要运动估计开发时域相邻帧的相关信息，所以系统中编码器可以较为简单，把计算量较大的帧间预测（如运动估计）转移到解码端。由此可以看出，分布式视频编码方案和传统视频编码相比具有明显的区别：基于运动估计的混合编码框架视频编码（如MPEG , H. 26x ）在编码端，各核之间通过运动估计，联合编码，解码端通过运动补偿，联合解码；基于帧内编码的视频编码（如Motion-JPEG）每帧基本上都是各自独立的进行编码和解码。

3 几种典型的分布式视频编解码方案
3.1 空间域Wyner-Ziv视颇编码
在分布式视频编码的各种方案中，以Bernd Girod等提出的Wyner-Ziv编码算法最具有代表性。空间域Wyner-ziv视频编码的编码端采用了两种编码方式：一种是Wyner-ziv帧，图像信号均匀量化后，进行基于turbo码的Slepian-Wolf编码，其目的是保持视频信号的基本轮廓；另一种编码采用的是传统视频编码中的帧内编码(如H. 263的帧内编码)作为关键帧(Key Frame )。
可见，在空间域Wyner-Ziv视频编码中，其编码仅仅是传统帧内编码或者基于turbo码的Wyner-Ziv编码，所以编码复杂度和传统帧内编码相当；而解码较为复杂，通过帧内解码、
turbo解码、运动估计、插值、和最大后验估计等进行联合解码，从而获得了较好的压缩效率。

3.2 频域Wyner-Ziv视频编码
    在空间域Wyner-Ziv视频编码算法中，Wyner-Ziv帧的编码是图像信号量化后，进行基于turbo码的Slepian-Wolf编码，没有压缩视频信号的空间冗余信息，所以压缩效果相对较差。Bernd Girod等在后续的研究中，以空间域Wyner-Ziv视频编码算法为基础，提出了域Wyner-Ziv视频编码算法。
    频域Wyner-Ziv视频编码和空间域Wyner-Ziv编码类似，都采用两种编码方式:Wyner-Ziv帧和关键帧。它们的不同之处在于对Wyner-Ziv帧的编码方式有所不同。
    由于提高了编码复杂度，频域Wyner-ziv视频编码的压缩效率比空间域Wyner-Ziv视频编码算法编码压缩效率更好。同时应该注意到，频域Wyner-Ziv视频编码算法编码的所需的存储单元有了一定的提高，某些编码模块类似于帧间预测。

3.3 PRISM视频编码
P.RIS14视频编码框架是由Rohit Puri等在2003年提出的，其编码框架和Bernd Girod等提出的频域Wyner-7iv视频编码方案类似，然而所提出的时间更早。
PRISM视频编码有二个主要特点：（1）计算复杂度可以根据编码端和解码端的实际情况，较为合理的分配；（2）编解码体系具有较好的鲁棒性；（3）灵活的码流结构。从实验结果来看，PRISM的编码效率在H.263+的帧内编码和帧间编码效率之间，总体来说PRISM的分布式视频编码方案是相当有效的。

3.4 分级Wyner-Ziv视频编码
Zixiang Xiong提出的分级Wyner-Ziv视频编码( Layered Wyner-Ziv video coding)也是一种较为代表性的分布式视频编码方案。在该编码方案中，基本层采用H.26L编码，增强层采用基于LDPC码的Wyner-Ziv编码。其Wyner-Ziv编码器的主要编码过程是依次进行DCT变换、嵌套标量量化（NSQ，nested scalar quantizer）和基于LDPC的Slepian-Wolf编码。
从文献实验结果来看，分级Wyner-Ziv视频编码的效果和MPEG-4/H.26L的精细分级编码(FGS，Fine Granular Scalability)大致相当。但重要的区别在于：在解码端，增强层(Wyner-Ziv帧)的编码和基本层(H.26L帧)的编码是独立进行的，没有任何关联，而在解码端则采用联合解码。所以和MPEG-4/H.26L分级编码相比，这种编码方式可以避免由于传输错误造成的编码和解码失配问题( encoder-decoder mismatch )，具有更好的抗误码特性。

4 结论和研究展望
    分布式视频编码的理论可行性虽然是20世纪70年代加以论证的，但对其实际编码系统的研究近几年才刚刚起步。分布式视频编码的提出与无线视频通信发展背景紧密相关。分布式视频编码的基本思想和传统视频编码有着明显的区别，它是一种新的视频编码框架，其主要特点是编码简单，解码复杂；和同等复杂的传统视频编码器相比压缩效率较高;固有的分层结构使得其抗误码性能较好，非常适合于便携式、耗电低、运算能力受限的无线视频发送终端。所以分布式视频编码作为未来无线视频通信的可选方案具有较大的竞争力。
    目前分布式视频编码的研究已经获得到了很多较有意义的成果，然而距离实用还有不少的差距，目前还存在一些需要进一步研究的问题，主要有以下几个方面：
（1）边信息估值和解码重建
    分布式视频编码的一个突出难点是如何准确的估计边信息。由于考虑到编码复杂度和压缩效率，编码端不可能提供太多的比特负载，这就需要在解码端通过对已解码的重建帧做运动估计，利用先验数学概率模型进行边信息估值。同时在解码重建函数中，需要考虑在发生误码的情况下(如边信息估值错误或当前帧传输出错)，如何实现解码的最佳重建。对于采用什么方式的运动估计算法得出更为精确的边信息，如何构建更佳的解码重建函数，目前只有一些具体改进的算法提出，然而这些算法缺乏较为详细的实验数据和理论分析。
（2）当前解码帧和边信息的概率统计模型
基于turbo, LDPC或者syndrome的分布式编码是典型的信道编码。分布式视频编码把每帧图像都看成彼此相关的信源，这样就把分布式信道编码概念引人视频编码领域。通常认为边信息和当前解码帧的概率分布近似满足Laplacian分布，而这一概率模型并不能精确描述所有的视频运动模式可能性。实验表明，当前解码帧和边信息的概率模型对解码重建的替棒性有非常重要的影响，有文献对其概率模型做了初步的探索，尚待进一步深人研究。
（3）编码的复杂度和压缩效率的权衡
    分布式视频编码是由于无线视频通信的需求而被提出的，并逐渐引起关注。注意到应用于无线环境下的分布式视频编码系统对编码器的要求较为苛刻，然而编码复杂度和编
码压缩效率是密切相关的。如何权衡编码复杂度和编码的压缩性能是设计实用视频编码系统的一个重要课题。有文献在PRISM分布式编码方案中分析研究了该问题，同时指出需要研究更为精确的数学模型解决该问题。
（4）分布式编码的抗误码特性
    在无线信道或者IP网络等误码易发环境下进行可靠视频通信，就必须在编码端进行有效的抗误码控制。由于分布式视频编码起源于信道编码的概念，在某种意思上，分布式视频编码是一种信源信道联合编码。有文献提出了分布式编码和传统视频编码和结合的抗误码编码方案，在视频序列的特定帧（peg frame）采用基于turbo码的Wyner-Ziv编码，其它帧采用H.26L编码；在这种抗误码编码的基础之上，有文献把原来基于turbo码的Wyner-Ziv编码改为基于LDPC码的Wyner-Ziv编码，得到了更好的实验结果。采用空间域Wyner-Zi，视频编码和MPEG编码相结合的抗误码编码方案也得到了比传统的前向误码保护(FEC ，forward error protection)更好的效果。
（5）分布式编码的可分级性
    视频编码的可分级性是编码器提供的一种码流表示，它能够解决视频传输网络或终端的异质问题，其中分级编码的码流包括一个提供基本视频质量的基本层和一个或多个增强层。有文献提出的把基于LDPC编码的Wyner-Ziv视频编码作为增强层，H. 26L作为基本层可以有和MPEG-4/H.26L的FGS编码近似的效果。有文献提出的基于MPEG-4的Wyner-Ziv可分级预测编码和MPEG-4 FGS的编码效率相比有明显的提高。可见分布式编码的编码独立性和解码的普棒性使得分布式编码有可能成为分级编码的理想实现方法之一。