原码，反码，补码

负数为什么要用补码来表示？

今天，发生一件非常有趣的事情。

公司同事问了我一个问题：为什么 2.0 - 1.1 = 0.89999999 呢？不应该是 0.9吗？

原来是，他问了周围一圈的同事，都给他的是同一个回答，说这是精度问题。他百思不得其解，怎么就会产生精度问题呢。再问，就没人知道原因了。

然后，我就看到了他抱着一本厚厚的书在看。拿过来一看，是一本Java书，厚厚的六百多页，这还仅是第一卷。哟呵，这是准备大干一场啊。

看在他这么努力学习的份上，还有他那对知识极度渴望的眼神。我决定，把我毕生所学传授与他。

于是，就给他详细讲解了，计算机中是怎么存储一个数的，十进制是怎么在转二进制的过程中丢失精度的，以及浮点数是怎么遵循IEEE 754 规范的，在浮点数进行加减运算的过程中会经历对阶、移位运算等过程，以及在此过程中是怎么丢失精度的。（这些问题在之前的文章中都有解答，参看“为什么0.1+0.2=0.30000000000000004”）

然后，成功的把他彻底搞懵逼了。怎么这么难啊。

原来，他的计算机基础比我还匮乏，不知道什么是位运算，不知道什么是原码、反码和补码。

本着我的热心肠，我就给他普及了一下这些知识 ---- 负数的补码形式和位移运算。

我们知道，一个数分为有符号和无符号。对于，有符号的数来说，最高位代表符号位，即最高位1代表负数，0代表正数。

在计算机中，存储一个数的时候，都是以补码的形式存储的。而正数和负数的补码表示方式是不一样的。正数的补码就等于它的原码，而负数的补码是原码除符号位以外都取反，然后 + 1 得来的。以一个int类型为例（4个字节即32位）

14的原码为：

0000 0000 0000 0000 0000 0000 0000 1110

它的反码、补码和原码都是一样的。

-14的原码为:

//最高位1为符号位，代表此数为负数
1000 0000 0000 0000 0000 0000 0000 1110

反码为原码除了符号位以外的其他位都取反（即0变为1，1变为0），

1111 1111 1111 1111 1111 1111 1111 0001

补码为反码 + 1 ，注意二进制中是满二进一。

1111 1111 1111 1111 1111 1111 1111 0010

位的左移，右移运算就是分别向左和向右移动N位。移位的规则是：

不管有没有符号位，左移都是在低位补0
带符号右移，是在高位补符号位，即正数补0，负数补1
无符号右移，无论该数是正数还是负数都在高位补0

因左移就在右边低位补0就可以了，比较简单，我就以负数的右移来举例，是怎么计算无符号右移和带符号右移的。还是以 -14 为例。

// -14的补码
1111 1111 1111 1111 1111 1111 1111 0010
// 带符号右移用 >> 表示，即右移一位 -14>>1，高位补符号位1，低位舍去
1111 1111 1111 1111 1111 1111 1111 1001
// 无符号右移用 >>> 表示，即右移一位 -14>>>1，最高位补0
0111 1111 1111 1111 1111 1111 1111 1001

我们可以通过程序来验证一下 -14>>1和 -14>>>1的结果是否正确。

1. -14>>1 = -7

//我们算出来 -14>>1的补码为：
1111 1111 1111 1111 1111 1111 1111 1001
//那它具体代表的数值是多少呢？
//首先，补码 -1 得到反码
1111 1111 1111 1111 1111 1111 1111 1000
//然后，反码取反得到原码，最高位符号位不变
1000 0000 0000 0000 0000 0000 0000 0111

这结果不就是 -7 吗，然后通过程序计算一下结果：

public class TestMove {
    public static void main(String[] args) {
        System.out.println( -14>>1);
    }
}

结果同样也是-7 。说明了我们位移操作没问题。

2. -14>>>1=2147483641

我们通过一段程序去验证：

package com.test.binary;

/**
 * @Author zwb
 * @DATE 2019/12/3 15:49
 */
public class TestBinary {
    public static void main(String[] args) {
        //我们自己计算出来的 -14>>>1 结果
        String bin = "01111111111111111111111111111001";
        double res = binToDec(bin);
        System.out.println(res);
        //通过计算机计算的结果
        System.out.println(-14>>>1);
    }

    //二进制转为十进制
    public static double binToDec(String bin){
        int index = bin.indexOf(".");
        int len = bin.length();
        double res = 0;
        //index为-1说明没有小数
        if(index == -1){
            for(int i = 0; i< len; i++){
                res += Math.pow(2,i) * Integer.parseInt(String.valueOf(bin.charAt(len-1-i)));
            }
        }else{
            //整数部分
            int partA = 0;
            for(int i = 0; i< index; i++){
                partA += Math.pow(2,i) * Integer.parseInt(String.valueOf(bin.charAt(index-1-i)));
            }
            //小数部分
            double partB = 0;
            for(int j = index + 1; j < len; j++){
                partB += Math.pow(2,index - j) * Integer.parseInt(String.valueOf(bin.charAt(j)));
            }
            res = partA + partB;
        }
        return res;
    }
}

运行之后的结果，可以在控制台打印看到：
file

上边第一个是我们自己通过推算它的补码，然后通过二进制转十进制的一个算法算出来的最终结果，第二个就是直接通过位运算算出来的结果。可以看到结果是一模一样的。

至此，是不是对原码，反码，补码以及位运算左移右移，有了比较清晰的认识了呢？

今天，我们深入探讨一下，为什么计算机中要用补码来表示负数？

首先，我们应该清楚，原码是方便给人看的。看到一个数的原码，我们就能根据符号位和后边的二进制位，计算出这个数的实际值。为了简单起见，我以一个字节8位来举例，如

// 1 的原码 ，最高位0代表正数
0000 0001
// -1 的原码， 最高位1代表负数
1000 0001

可以看到，1和 -1 的原码只有符号位不同。然后，思考一个问题，1 - 1 = ？

是的，我们可以直接通过减法去计算，得出1-1=0 。但是，做减法运算时，可能会遇到不够减而需要借位的情况，这显然是比较麻烦的。我们换一种思路。 1-1 在数学中等同于 1+(-1)。这样，把减法转换为加法就简单的多了，只需要考虑进位就可以了。（其实，计算机中只有加法器，没有减法器，因此减法是通过加法器来计算的。）

于是，我们看下，把1和-1的原码相加等于多少（需要让符号位也参与运算）

  0000 0001
+ 1000 0001
  1000 0010

结果是 -2 ，这显然不符合我们的预期。

为了解决原码减法的问题，于是，出现了反码。使用反码，再来计算一下。

// 1的反码，同原码
0000 0001
// -1的反码，符号位不变，其他取反
1111 1110

相加之后，得 1111 1111 ，这是反码，转为原码为 1000 0000 ，即为 -0 。

但是，这又有问题了，在数学中0就是0，怎么到这还有 -0，+0之分。按照原码的概念来算，+0的原码为0000 0000 ， -0 的原码为 1000 0000 。问题就出在这了，如果遇到0的计算，是应该用 +0 还是用 -0 计算呢，这就会产生分歧。于是，补码出现了，解决了0的符号问题。

// 1的补码，同原码
0000 0001
// -1的补码，反码 +1
1111 1111

相加得 1 0000 0000 ，最高位进位之后，超过了8位，于是舍去，即为0000 0000。此为补码，转为原码也是0000 0000 ，这不就是0 吗。

这样一来，用补码0000 0000来表示0，就解决了+0和-0在原码上的分歧，统一了0的二进制表示方法。

那，又有疑问了，-0跑哪去了呢？其实，-0即1000 0000在这用来表示 -128。但是，注意表示的是 -128的补码，因此 -128没有原码和反码。

那为什么用 1000 0000表示 -128呢？

先看下 -127 的原码、反码和补码：
原码: 1111 1111
反码: 1000 0000
补码: 1000 0001

我们知道数学中 -127 -1 = -128 ，所以 -127的补码 -1 也应该等于 -128的补码，即
1000 0001 -1 = 1000 0000。因此1000 0000就是 -128的补码。

在一个字节8位中，如果用原码来表示值的大小范围，只能是 1111 1111 ~ 0111 1111，即-127~127 。但是，如果用补码就可以表示 -128~127，正好是2^8，256个数。

因此，-0可以表示一个最低数。在8位二进制中它是1000 0000 ，在32位中，它就是 1000 0000 0000 0000 0000 0000 0000 0000 ，int的最小值。（32位数值大小范围为 -2^31 ~ 2^31 -1）

总结：补码的存在解决了0的符号问题，同时统一了计算机的加减法运算。