计算机组成与设计（五）—

4-bit加法器示例

先看一下上一节得到的加法器实现，可以看出改进的地方。

不难发现整个过程是从右至左依次执行，每一个进位需要等前面的运算全完成，可以在一开始得到所有的进位吗？

像上面4-bit加法器这样实现的加法器被称作行波进位加法器,所有的进位像波浪一样向左推进。

4-bit RCA的门电路实现

我们考察其中的关键路径（延迟最长的路径）

总延迟时间：(T + T)*4 + T = 9T,推广到n位，总时间为(2n + 1)*T。降低总延迟时间就是我们优化的方向。

主要思路：提前计算出“进位信号”。对进位信号进行分析：

$C_{i+1} = (A_i · B_i) + (A_i · C_i) + (B_i · C_i) = (A_i · B_i) + (A_i + B_i) · C_i$

设：生成信号(Genarate)：$G_i = A_i · B_i$,传播信号(Propagate)：$P_i = A_i + B_i$,则：$C_{i+1} = G_i + P_i · C_i$

如果把这看作一个递推公式，这是一个等差函数，通项可直接求出来，且只与$A_i$和$B_i$有关。这样就可以提前计算出每个“进位信号”，如图：

分析一下电路实现

像上面那样通过一个电路提前计算进位的加法器叫做超前进位加法器，具体如图：

其中，C₁、C₂、C₃、C₄都由下面的电路计算好，需要3级门延迟，然后在全加器中关键路径上还有1级延迟，如图

所以，总共有4级门延迟。