1.简介

　　经典的SRCNN无法满足实时性要求。经过研究我们发现这是因为其存在两个固有的局限：

1.由于SRCNN是先插值放大再输入网络，我们的计算复杂性就随着HR图像的尺寸平方次递增。例如，假如放大倍数为n，则计算代价是原始LR计算代价的$n^{2}$倍。如果网络直接学习LR图像，则可以加速$n^{2}$倍。

2.第二个局限是非线性映射层。输入图像块被映射到高维LR特征空间中，然后非线性映射到高维HR特征空间中。映射层更宽可以大大提高精读，但也降低了计算速度。

　　解决第一个问题的思路是，使用后端升采样的思路，在最后一层添加转置卷积，如此一来计算复杂度仅仅和LR图像的尺寸成正比。

　　解决第二个问题的思路是，使得非线性映射处在低维特征空间中。

　　我们的FSRCNN还有一个好处，就是针对不同的放大系数可以共享权值（转置卷积层以外的层的权值）

本文主要贡献三点：1.重新设计的沙漏型网络结构。2.实时性处理。3.针对不同放大系数的快速训练及测试。

2.Related Work

2.1 SR

　　SRCNN一经问世，迅速得到应用。有学者将其应用于具体领域，也有学者尝试更深的网络，也有学者使用基于先验知识的子网络代替SRCNN中第二层。但是都存在相应的问题。

2.2 CNN加速

　　很多学者试图加速CNN。我们的模型主要有两点区别：1. 其他学者专注于对现有训练好的模型的近似，而我们直接重新设计了网络结构。2.那些方法都是针对高层CV问题设计的，我们是针对底层问题。我们的模型不包括FC层，filter的近似值将严重影响结果。

不多介绍

　　网络分为五部分：特征提取，压缩，非线性映射，扩充，转置卷积

　　网络的参数很多。其中对不敏感参数预先设定一个值，敏感参数未设定。敏感参数往往代表一些重要影响因素。

　　这部分类似于SRCNN 中的第一层，不同之处在于SRCNN是从插值图像抽取特征，而此处是从原始LR图像抽取特征。

　　超参设置：由于SRCNN中是从插值图像提取特征，f=9；而本文是从原始图像提取特征，因此设置f=5即可覆盖9*9的patch。另外设置c=1。现在只有filter数量$n_{1}$未设置，$n_{1}$也可以看作是LR特征的维度。$n_{1}$是第一个敏感向量。$n_{1}$记作d

　　第一层被表示为Conv(5, d, 1)

　　在SRCNN中，由于d很大，所以第二层计算复杂度相对大，这一现象也存在于高层视觉任务中。

　　我们在第二层添上一个shrinking层来降维，使用的是1*1卷积，$n_{2}$=s.　　s<<d.

　　这一层被表示为Conv(1, s, d)

　　非线性映射层的宽度和深度很关键。由于5*5卷积效果比1*1好，我们取一个折中3*3.为了保持好的表现，我们使用多个3*3卷积代替一个更宽的。

　　这一层被表示为m*Conv(3, s, s)

　　这是shrinking层的反向过程。如果直接使用低维特征生成HR图像，效果降低（Set5上降低了0.3dB）。因此我们先将特征维度进行扩充。

　　这一层被表示为Conv(1, d, s)

　　DeConv(9; 1; d)

　　转置卷积的相比直接插值的好处在于参数可学习。观察图三可知，转置卷积中学习到的filter像第一层一样是有意义的。

　　激活函数：使用PReLU以避免ReLU出现的dead feature

　　$$f left( x_{i} ight) = max left( x_{i}, 0 ight) + a_{i}min left( 0, x_{i} ight)$$

　　损失函数：MSE

　　网络结构：Conv(5; d; 1)−PReLU −Conv(1; s; d)−PReLU −m×Conv(3; s; s)−PReLU − Conv(1; d; s) − PReLU − DeConv(9; 1; d)

　　　　计算复杂度：

　　主要体现在本表中。首先使用转置卷积代替插值，速度得到加快，效果得到微微提升。之后改造映射层，参数大幅减少，速度大幅提升，效果得到微微提升。最后改造特征提取层，嫌少了一些冗余的参数，速度得到提升，同时效果得到很微弱的提升。

　　本网络中，只有最后一层含有放大系数的信息。实验表明，针对不同放大系数，本网络的卷积层filter几乎相同。而在SRCNN中针对不同放大系数，filters是截然不同的。

4.实验

4.1 实验细节

　　数据集：91image+General-100.　　数据增强：scaling:0.9, 0.8, 0.7, 0.6, 2.　;旋转：90, 180, 270度旋转

　　测试集验证集：测试集：Set5 , Set14 and BSD200　　验证集：BSD200中抽取20张。