【刷题】计算机组成原理--数据的表示及其运算（转）

原文链接：https://blog.csdn.net/redRnt/article/details/83384255

知识点：

一、数的补码原码移码表示

无符号数与有符号数

无符号数，即没有正负号的数，是数的绝对值，在其面前添上正负号，便成了有符号的数。计算机的数均存放在寄存器中，通常我们称寄存器的位数为机器字长，当存放有符号数的时候，需要占用以为存放符合位，所有，如若机器字长为16位，那么： - 无符号数可表示的范围为 0 — 2^（16） -1 - 有符号数可表示的范围为 -2^15 — 2^（15） - 1

15次方是因为符号位占用了一位。那么计算机如何表示有符号数呢？我们规定，用0表示正号，用1表示负号，这样符号也就被数字化了，并规定放在有效数据之前，例如： +0.1011 在机器中表示为0（小数点位置）1011 -1100 在机器中表示为1，1100（小数点位置）为了方便区分手写的数和将符号数字化的数，我们把前者称为真值，后者称为机器数。即 -1100（真值） -> 11100（机器数）将符号数字化以后带来了新的问题，运算时，符号位是否参与运算，如果是，那么如何处理？为了处理好这些问题，于是就引入了原码，补码，反码和移码等编码方式。

原码：

原码，又称带符号的绝对值表示，符号位为0表示正，为1表示负。用大白话来讲，就是直接将数值部分写成二进制数然后前面添上0或者1，用来表示正负号。

其实上面的公式我们只需要了解即可，实际的转换很简单比如

X = +1110时 [X]原 = 0,1110

X = -1110时 [X]原 = 1,1110 （逗号只是为了区分符号位实际不存在）

X = 0.1101时 [X]原 = 0.1101

X = -0.1101时 [X]原 = 1,1110（注意不是10.1101，因为0并不是有效数据位）。

注意： 1. 若字长为n+1，那么原码整数的表示范围为：

2. 原码中0的表示方式有两种：

0的原码表示方法不唯一

补码：

计算机中存放的数值方式大多数是用补码存放，计算（尤其是减法做加法运算时）时也通常采用补码运算方式，因此要对补码非常敏感。

对于纯整数：

对于纯小数：

而对于0而言，

反码

反码，通常用来由原码求补码或者由补码求原码的过渡环节。我们先看看数学定义：

对于纯小数：

对于纯整数：

所以，*记住上面的表示范围就够了*，我们具体看看运算过程，取反操作就是将原码中的0换成1,1换成0.就完事了。

当X = +1101时，X反 = 0，1101 当X = -1101时，

X反 = 1，0010（当为负数的时候，符号位不变，数值位执行取反操作）

当X = +0.0110时，X反 = 0.0110 当X = -0.0110时，X反 = 1.1001

对于0来说，反码的表示方式也有两种（0，000或者1,111），这就自己去写了。

0的反码表示不唯一

三种之间的关系：

三种机器码的最高位均为符号位，符号位与数值位用逗号隔开
当真值为正时，原码补码反码表示方式相同。
当真值为负时，三者表现都不同，但是符号位都用1表示，补码可以用“原码求反（不含符号位）后加1”求得。而反码是原码除了符号位以外的部分都进行取反操作。
其中0在移码和补码中的表示方式都是唯一的。

移码

当真值用补码表示的时候，由于符号位与数值位一起编码，这与习惯上表示不同，我们很难从补码形式上直接判断真值的大小。但是如果对每个真值位（注意不包含符号位），都加上一个2^n（n为整数位），那么在数轴上，移码表示的范围恰好对应真值在数轴上移动2的n次方个单元。所以叫做移码。

它常常用来表示浮点数的阶数，因为它只能表示整数。对于移码来说，0的表示是唯一的，假设字长为6位（含一个符号位）那么0的表示为：

+0移 = (2^5) + 0 =1,00000

-0移 = (2^5) - 0 =1,00000

特点：

1. 0 的表示方式唯一

2. 对于同一个真值，移码和补码相差一个符号位，且相反，例如：-11110 补码为1,00010，移码为：000010

3. 引入移码是为了直观的判断真值大小，所以移码大，真值就大

二、二进制与16进制

三、强制类型转换

基本数据类型

整型（int）：即定点整数，在寄存器中一般用补码表示，其最高位代表符号位，一般是4个字节。具体的位数跟变异平台有关。
无符号整数（unsigned）：无符号，即不考虑数据位，二进制码表示的数就是其值。一般用补码表示。
长整型和短整型（long short）：用补码表示，这只是位数不同罢了（一个长一个短）。
单精度浮点数和双精度浮点数（float double）：就是我们平时说的小数点会移动的小数，前面的32位，后面的是64位。

数据间的保留，当计算记过超出机器所能表示的范围的时候，就会发生“溢出现象”。此时面临一个问题，那么是丢掉前面的N位还是丢掉后面的N位呢？一般我们选择保留后面的N位，丢掉前面的N位，若丢掉后发现不能表示正确的结果，说明产生溢出，还有一种情况就是不受影响了。

强制类型转换实际上是位值不变，只是改变了解释这些位的方式。

当数据太大，用二进制不好表示的时候我们选择用16进制（在之前提到过），分别是0x000286a1，0x86a1，0xffff7751, 0x7751,可以看出大字节转向小字节的转换的规则是：低位直接赋值（赋几位就看你的数据占几位，比如short占2字节，16位，一个16进制数代表4位2进制数），高位直接截断。

输出的数用16进制表示我就不说了，结论：从短字长到长字长的转换，相应的位值不变，向高位补充的数为符号位，所以-4321前面的16位都是1，因为它符号位是负号，如果是正号，那就变成0.

四、定点数及其加减运算

定点数

定点数：小数点固定在某一个位置的数，有纯小数和纯整数之分。假设数据用原码表示，那么：纯小数可以表示为

对于纯整数，可以表示为：

对比前面两幅图，只是小数点的位置不一样而已，在末尾表示整数，在内部表示小数。那么为什么表示整数的时候我们要减去一个1呢？我们回想一下原码的表示范围就会发现，原来是原码中0可以有两种不同的表示方式，因此减去一个重复的0.

定点数的运算

定点数的运算主要包括，移位，加，减，乘，除运算。其中移位运算是基础，加减运算是重点，乘除运算过程繁杂，不大可能在考试中出现。

移位运算

计算机中的定点数的小数点位置都是事先约定好的，所以二进制的小数点移动相当于乘上或者除以2的指数。就很像我们十进制中的移位：

15 -> 150 //小数点右移一位相当于乘10

15 ->1.5 //小数点左移一位，相当于除10

那么类比到二进制来说，就是乘上或者除以2^n。对于有符号数的移位，我们称为算术移位，移位运算也称移位操作。

操作的规则如下：

无论是正数还是负数，移位前后符号位不变
真值为正的时候，左右移动均添0
若真值为负，那么分下面三种情况：（1）原码添0 （2）补码左移添0，右移添1 （3）反码添1

移位可能带来的问题：

1. 对于正数而言：左移的时候最高位可能丢1，即把1移出去了，造成溢出。反之，右移有可能把最低位的1移出去，影响数据的精度。

2. 对于负数而言：原码与上述情况一致，因为都是添0，而反码的左移添加的是1，右移也是如此，因此均会造成0的丢失影响精度。对于补码来说做移高位丢0，右移丢1，精度都不对。

加/减运算

计算机中，加法减法的运算是最基本的运算，其中我们平时的计算中也可以知道的是，减法可以当做加法进行运算。比如： A - B = A +(-B); 由于我们前面说过，引入补码的原因就是为了方便计算，所以我们都采用补码来进行运算的。

基本公式（或者说理论基础）： [A]补_+ [B] 补= [A + B]补 [A]补 - [B]补 = [A]补 + [-B]补

其中 [-B]补称为求补后的减数，由[B]补，连同符号位在内，每位取反，末位加1所得。

下面看两道计算题：（1）已知X = +1001 ,Y = -0101,求【X+Y】补，以及X+Y。

这里，我们可以明显的看到，在使用补码的运算中，符号位参与了编码并且一起参与了运算。因为符号位只有一位所以舍弃最高的一位。

（2）已知某机器字长为8位（含一位符号位），令A = 15,B =24, 求【A+B】补和（A-B）。

溢出判断

考虑这样一个问题，机器字长仍为8位，其中A = -93，B = 45.按照计算规则，我们有：

很明显我们的计算过程是没有任何的问题的，但是问题出在我们把符号位参与了运算，我们根据常识知道结果为 -138 而138显然大于2^7 = 128.所以7位数值位不足以容纳超过128（不用减一因为补码表示的0唯一）的数。这种计算结果超过机器字长的现象我们称为溢出。

1. 肉眼观察法（做题好用）这种往往看似很蠢的方式，却是最直观也是最有效的方法。就是通过对计算结果的大致估计来判断是否发生溢出。就比如上题，我们显然可以直接算出 -93-45 = -138，显然会发生溢出。对于一些判断溢出的方式往往这种方式最有效。

2. 一位符号位判断溢出（计算机中判断方式之一）我们先看看溢出的必要条件是什么，同号相加，异号相减才有可能发生溢出。因此无论是做加法还是减法，只要实际参与操作的两个数（减法为【-B】补），符号相同，结果又与原操作数符号不同，即可以说明发生了溢出。

看下面一道例题：设某机器字长为4位（含一位符号位）当A = 5，B = 4时，有：

当A = -5,B = -4时，有：

这个时候产生了两个符号位，我们舍去最高的符号位，剩下0为符号位。

3. 两位符号位判断溢出两位符号位的补码，也称变形补码。即在原符号位的前面加多一位符号位，这个加上去的符号跟之前的符号位一样。

比如：【X】补 = -0.1011 加多一位符号位变为 11.1011

【X】补 = 0.1011 加多一位符号位变为 00.1011

原理：当结果的2位符号位不同时（即01或者10），表示溢出，且高位（就是第一位）的符号位永远代表着真正的符号。举个例题：

五、浮点数及其加减运算

相对于定点数，浮点数就是小数点可以浮动的数。通常用来表示数值范围相差很大的数（比如太阳的质量跟电子的质量相差）。通常我们使用这样的表达式来表示浮点数：

其中，r表示底（因为是指数的形式，一般取2的n次方），E表示阶码（阶码可正可负）。M为位数（可正可负）。当r = 10的时候，就是我们熟悉的科学计数法。在计算机中我们研究的是r = 2的时候。

规格化数与浮点数的规格化

为了提高数据的精确度以及便于比较浮点数的大小，在计算机中规定浮点数的尾数用纯小数表示。其中尾数最高位为1的浮点数称为规格化数。比如 N = 0.110101 X 2^10.尾数的最高位为1.所以称为规格化数。为了提高浮点数的精确度，要求其尾数必须为规格化数，如果不是规格化数，那么就要修改阶码的值并同时左右移尾数的方法，使其变为规格化数。根据尾数的移动位置，我们将规格化分为左规和右规（待会详细说）。我们先来看看一个十进制数的移动：

二进制的移动也是如此的。因此我们得到这样的结论：

从图中我们可以看出至少这几点：

1. 对于原码而言，其规格化数的最高位一定是1

2. 对于补码而言，其规格化数的最高位一定与符号位相反

3. 对于正数，无论其是原码还是补码，规格化后的形式一样

4. 对于负数，补码的规格化数是原码规格化数的除了规格化位以外的全部取反

IEEE754标准

现代计算机的浮点数一般采用IEEE定制的国际标准，这种标准形式如下：

根据浮点数的位数的不同，常见的浮点数有三种，短浮点数（float），长浮点数（double），临时浮点数。具体形式如下：

考试中，最常出现的当属短浮点数（float）了，因为长浮点数位数较多且原理与短浮点数一致。

1. 最高位为符号位，占用一位的空间

2. 阶码为8位，以移码的方式存储，阶码表示的范围为[1 ~ (2^8) - 1],为什么不是0-255？因为全0用来表示无穷大，全0表示非规格化数。

3. 尾数数值位为23位，在这里采用了隐藏位策略，由于我们规定了尾数最高位为1，也就是说数值位的第一位总会是1，所以我们可以采用23位来表示24位的数（我们把最高位的数值位隐藏了起来）。即不在23位数值位中存储这个1（这部分内容经常考！！）

4. 偏置值，对于float数而言，偏置值为127（(2^7) - 1,其中，全一表示无穷大，至于为什么是7次方不是8次方，回顾移码的定义），表示阶码的移动。在存储浮点数阶码之前，要将偏置值加到阶码的真值上。比如阶码为3，那么移码表示的阶码为： 127 + 3 = 130（80H）。

所以，规格化后，float数的真值为：

其中 s = 0代表正数，s = 1 代表负数。由我们刚刚讨论出来的各个字段的范围可以得到float浮点数的表示范围：显然，当E = 1，M= 0 的时候，浮点数最小，当 E = 254, M = 111111...（23个1）.的时候，浮点数最大；

浮点数的加减运算

同定点数相同，浮点数的加减也采用补码的形式运算，不同的是，浮点数运算的过程较为麻烦。

1. 对阶即小数点的位置对齐，此时两个浮点数的阶码相等。因此我们首先得得出两个浮点数相差几阶。由小阶转向大阶，具体操作是将数值部分右移一位, 此时阶码 +1。（这里面隐含着舍弃掉有效位的风险）

2. 尾数求和对阶后就好办了，对阶完相当于小数点位置确定，直接进行定点数的加减。

3. 规格化规格化，浮点数的规格化通常采用双符号位，前面我们已经说过双符号位这个概念了。

符号位和最高位相同时需要左规，溢出时需要右规采用双符号位来计算

4. 舍入在对阶和右规的过程中，尾数的低位有效位位很可能移丢（因为是小转大），这时候就会影响精度产生误差（注意，产生误差≠结果错误）。这样的溢出我们称为尾数溢出。因此必须对尾数进行舍入。常用的方法有：

恒置“1”法：无论右移舍去的是谁，都在末尾添加1
舍“0”入“1”法：右移过程中，尾数是0则舍去，是1，则尾数末尾加1.（存在尾数再次溢出的风险）

5. 溢出判断判断浮点数的溢出，我们采用双符号法，但是与定点数有一点不同：当尾数之和出现01.XXXXXX或者10.XXXXXX的时候，并不能直接下结论溢出，应当再右规一次，才能判断是否真的溢出，且规后发现其阶码的符号位出现01或者10的时候，说明溢出

浮点数的加减运算（实例）

下面是一道2009年的408的考试真题：

我们先看看，首先第一步没得说，先写出X和Y的二进制表示（分数转二进制很好转，百度一下就行，有个百度经验，用我们平时的同底数幂相除来算，很是方便），注意含有两个符号位：

然后按步骤做题：

这一步我们发现这个时候X和Y的阶码已经相同（00，111）了。

这里注意，尾数右规是指尾数部分右规，那么尾数的符号位也是在尾数中的。

补充知识：

大端对齐与小端对齐

大端对齐模式：是指一个字节中的高位字节放在这个字节区域内的低地址处。

小端对齐模式：是指一个字节中的低位字节放在这个字节区域内的低地址处

将一个32位的16进制数0x12345678存放在内存中（机器按字节编址）

实际上，小端模式就是从后面往前面存储的。

常用的进制转换数及一些技巧

127 = 7FH = 0111 1111B
128 = 80H = 1000 0000B
255 = FFH = 1111 1111B
65535 = FFFFH = 1111 1111 1111 1111B

算大的数可以用16进制数方便计算，十进制转二进制也可以转换为16进制再转换为2进制。

按边界对齐

按边界对齐？简单的说，对于int型而言，起始地址为4的倍数；对于char类型而言，起始地址为任意字节皆可；对于short类型而言，起始地址为2的倍数；对于结构体而言，对齐方式为结构体内类型最大的字节量。

强制类型转换

第一道题

分析：
算式显然是 int = int +short 类型，一定存在强制类型转换，那么short ->int 需要添加扩展位，注意，机器中的数用补码表示的，所以结果用补码运算。过程如下：
图中虚线左边的是16进制数，右边是2进制数，由于答案是16进制数，我们便化为16进制数进行加减。
同时，特别注意，负数的补码，是除了符号位以外取反后加1 正数的补码等于原码等于反码

考点：强制类型转换，码制间的转换运算

127原码=127补码=01111111=7F

-9原码=10001001 -9补码：11110110+1=11110111=F7

因为机器中数据是用补码表示的，所以要用补码计算

第二道题：

分析：短字节向长字节的转换，高位的扩展位变为对应的符号位

65535为正数，高位补0

第三道题：

分析：无符号与有符号之间的相互转换，主要看对符号位的解释，将符号位当成符号就是有符号数，当成真值解释就是无符号数。机器中用补码表示数。

-32767二进制为：1111111111111111(二进制)补码为1000000000000000+1=1000000000000001 表示为无符号数是32769

定点数基本运算及存储方式

第一道题

分析：
这是一道表面考定点数补码的乘法的问题，但是学过的都知道，乘法的计算太啰嗦了，而且要记忆的东西步骤也极为麻烦，所以出在考试大题不大可能，出现在选择题更不可能，而这个题目，一开始就让我们计算四个数分别相乘的组合。老老实实做，那么做完你也应该快考完了。所以换个角度，直接判断是否溢出，将它们化为10进制真值，用结果看看能不能用8位表示。说白了还是考码制之间的转换。

考点：码制间的转换与运算，溢出判断

第二道题

分析：关键词按字节编址，按边界对齐，小端方式。我们知道int是占用4个字节的，char1个字节，short为2个字节，加起来要7个字节，但是实际上是8个。因为它按边界对齐。我们注意到，按顺序short应该到D，但是D = 13，不是2的倍数，所以从E开始存储。
所以过程如下：

第四道题

分析：如果直接死脑筋算的话，很是麻烦，看看有没有好的办法，二进制数对2的乘除，就是移位操作，乘上一个2，左移。除去一个2，右移。实在忘记了，就举个10进制的例子：
2 X 10 = 20 //相当于将2左移一位
20/10 = 2 //相当于把20右移了一位。这样就好办了：

有符号数移位时，都是按照补码的形式移位：

右移：最右边的一位舍弃，最左边补符号位。

左移：最左边的一位舍弃，最右边补0。

103二进制：01100111 -25二进制：10011001 103补码：01100111 -25补码：11100111 -y的补码：11100111