第九章转移指令的原理

8086CPU的转移指令分为以下几类：
无条件转移指令（如：jmp）
条件转移指令
循环指令（如：loop）
过程
中断

9.1 操作符offset----------伪指令

操作符offset在汇编语言中是由编译器处理的符号，它的功能是取得标号的偏移地址。
比如下面的程序：
assume cs:codesg
codeseg segment

    start:mov ax,offset start ; 相当于 mov ax,0
         s:mov ax,offset s      ; 相当于mov ax,3
  codesg ends
  end start

assume cs:codesg
codesg segment
s: mov ax,bx ;（mov ax,bx 的机器码占两个字节）
mov si,offset s
mov di,offset s0
mov ax,cs:[si]
mov cs:[di],ax
s0: nop ;（nop的机器码占一个字节）
nop
codesg ends
ends

9.2 jmp指令

jmp为无条件转移，可以只修改IP，也可以同时修改CS和IP；

jmp指令要给出两种信息：
转移的目的地址
转移的距离（段间转移、段内短转移，段内近转移）

9.3 依据位移进行转移的jmp指令

jmp short 标号（转到标号处执行指令）

这种格式的 jmp 指令实现的是段内短转移，它对IP的修改范围为 -128~127，也就是说，它向前转移时可以最多越过128个字节，向后转移可以最多越过127个字节。
比如：程序9.1
assume cs:codesg
codesg segment
start:mov ax,0
jmp short s
add ax,1
s:inc ax
codesg ends
end start

程序执行后， ax中的值为 1 ，因为执行 jmp short s 后，越过了add ax,1 ，IP 指向了标号 s处的 inc ax。也就是说，程序只进行了一次ax加1操作。
我们可以看到，Debug 将 jmp short s 中的 s 表示为inc ax 指令的偏移地址 8 ，并将jmp short s 表示为 jmp 0008 ，表示转移到cs:0008处。

但是我们观察对应的机器码，却意外地发现了一些问题……
jmp 0008 （ Debug 中的表示）或jmp short s （汇编语言中的表示）所对应的机器码为EB 03，注意，这个机器码中竟不包含转移的目的地址。

这意味着，CPU 在执行EB 03的时候，并不知道转移目的地址。
那么，CPU根据什么进行转移呢？

没有了目的地址，CPU如何知道转移到哪里呢？

我们做下小小的修改~
加一段代码之后
机器码变成了 EB 05
这说明在机器指令中并不包含转移的目的地址。

如果机器指令中不包含目的地址的话，那么，也就是说 CPU不需要这个目的地址就可以实现对IP的修改。

小B可能会问：“老师，那么具体是如何修改的呢？”

jmp short s指令的读取和执行过程：
（1）(CS)=0BBDH，(IP)=0006，CS:IP指向EB 03（jmp short s的机器码）；
（2）读取指令码EB 03进入指令缓冲器；
（3）(IP)=(IP)+所读取指令的长度=(IP)+2=0008，CS:IP指向add ax,1；
（4）CPU指行指令缓冲器中的指令EB 03；
（5）指令EB 03执行后，(IP)=000BH，CS:IP指向inc ax。
实际上，指令“jmp short 标号”的功能为(IP)=(IP)+8位位移。
（1）8位位移=“标号”处的地址-jmp指令后的第一个字节的地址；
（2）short指明此处的位移为8位位移；
（3）8位位移的范围为-128~127，用补码表示
（如果你对补码还不了解，请阅读附注2）
（4）8位位移由编译程序在编译时算出。

还有一种和指令“jmp short 标号”功能相近的指令格式：
jmp near ptr 标号
它实现的时段内近转移。

指令“jmp near ptr 标号”的功能为：
(IP)=(IP)+16位位移。

指令“jmp near ptr 标号”的说明：
（1）16位位移=“标号”处的地址-jmp指令后的第一个字节的地址；
（2）near ptr指明此处的位移为16位位移，进行的是段内近转移；
（3）16位位移的范围为
-32769~32767，用补码表示；
（4）16位位移由编译程序在编译时算出。

9.4 转移的目的地址在指令中的jmp指令

前面讲的jmp指令，其对应的机器码中并没有转移的目的地址，而是相对于当前IP的转移位移。

指令 “jmp far ptr 标号”
实现的是段间转移，又称为远转移。
指令 “jmp far ptr 标号” 功能如下：
(CS)=标号所在段的段地址；
(IP)=标号所在段中的偏移地址。
far ptr指明了指令用标号的段地址和偏移地址修改CS和IP。

我们看下面的程序
assume cs:codesg
codesg segment
start:mov ax,0
mov bx,0
jmp far ptr s
db 256 dup (0)
s: add ax,1
inc ax
codesg ends
end start
源程序中的db 256 dup (0)，被Debug解释为相应的若干条汇编指令。这不是关键，关键是，我们要注意一下jmp far ptr s所对应的机器码：EA 0B 01 BD 0B ，其中包含转移的目的地址。
“0B 01 BD 0B” 是目的地址在指令中的存储顺序，高地址的“BD 0B”是转移的段地址：0BBDH，低地址的“0B 01” 是偏移地址：010BH。

9.5 转移地址在寄存器中的jmp指令

同时修改CS、IP的内容：
转移指令jmp 段地址：偏移地址
jmp 2AE3:3
jmp 3:0B16

功能：用指令中给出的段地址修改CS，偏移地址修改IP。
仅修改IP的内容：

jmp 某一合法寄存器
jmp ax （类似于 mov IP,ax）
jmp bx

功能：用寄存器中的值修改IP。

9.6 转移地址在内存中的jmp指令

转移地址在内存中的jmp指令有两种格式：

（1） jmp word ptr 内存单元地址（段内转移）
功能：从内存单元地址处开始存放着一个字，是转移的目的偏移地址。

内存单元地址可用寻址方式的任一格式给出。

mov ax,0123H
mov ds:[0],ax
jmp word ptr ds:[0]
执行后，(IP)=0123H

mov ax,0123H
mov [bx],ax
jmp word ptr [bx]
执行后，(IP)=0123H

（2） jmp dword ptr 内存单元地址（段间转移）

功能：从内存单元地址处开始存放着两个字，高地址处的字是转移的目的段地址，低地址处是转移的目的偏移地址。
	(CS)=(内存单元地址+2)
	(IP)=(内存单元地址)
内存单元地址可用寻址方式的任一格式给出。

mov ax,0123H
mov ds:[0],ax
mov word ptr ds:[2],0
jmp dword ptr ds:[0]

执行后，
(CS)=0
(IP)=0123H
CS:IP 指向 0000：0123。

mov ax,0123H
mov [bx],ax
mov word ptr [bx+2],0
jmp dword ptr [bx]

执行后，
(CS)=0
(IP)=0123H
CS:IP 指向 0000：0123。

9.7 jcxz指令

jcxz指令为有条件转移指令，所有的有条件转移指令都是短转移，在对应的机器码中包含转移的位移，而不是目的地址。对IP的修改范围都为-128~127。

指令格式：jcxz 标号
（如果(cx)=0，则转移到标号处执行。）

jcxz 标号指令操作：
当(cx)=0时，(IP)=(IP)+8位位移）
8位位移=“标号”处的地址-jcxz指令后的第一个字节的地址；
8位位移的范围为-128~127，用补码表示；
8位位移由编译程序在编译时算出。

当(cx)≠0时，什么也不做（程序向下执行）。

我们从 jcxz的功能中可以看出，指令“jcxz 标号”的功能相当于：
if((cx)==0)
jmp short 标号；

（这种用C语言和汇编语言进行的综合描述，或许能使你对有条件指令理解得更加清楚。）

补全编程，利用jcxz指令，实现在内存2000H段中找查第一个值为为0的字节，找到后，将它的偏移地址存储在dx中。
assume cs:code
code segment
start: mov ax,2000H
mov ds,ax
mov bx,0
s: mov ch,0
mov cl,[bx]
jcxz ok
inc bx
jmp short s
ok: mov dx,bx
mov ax,4c00h
int 21h
code ends
end start

9.8 loop指令

loop指令为循环指令，所有的循环指令都是短转移，在对应的机器码中包含转移的位移，而不是目的地址。

对IP的修改范围都为-128~127。

指令格式：loop 标号
((cx))=(cx)-1，如果(cx)≠0，转移到标号处执行。
loop 标号指令操作：
（1）(cx)=(cx)-1;
（2）如果(cx)≠0，(IP)=(IP)+8位位移。
8位位移=“标号”处的地址-loop指令后的第一个字节的地址；
8位位移的范围为-128~127，用补码表示；
8位位移由编译程序在编译时算出。

当(cx)=0，什么也不做（程序向下执行）。

我们从loop的功能中可以看出，指令“loop 标号”的功能相当于：

(cx)--;
if((cx)≠0)
jmp short 标号

补全程序，利用loop指令，实现在内存2000H段中查找第一个值为0的字节，找到后，将它的偏移地址存储在dx中。

assume cs:code
code segment
start: mov ax,2000h
mov ds,ax
mov bx,0
s: mov cl,[bx]
mov ch,0
inc cx
inc bx
loop s
ok: dec bx
mov dx,bx
mov ax,4c00h
int 21h
code ends
end start

9.9 根据位移进行转移的意义

前面我们讲到：
jmp short 标号
jmp near ptr 标号
jcxz 标号
loop 标号
等几种汇编指令，它们对 IP的修改是根据转移目的地址和转移起始地址之间的位移来进行的。在它们对应的机器码中不包含转移的目的地址，而包含的是到目的地址的位移距离。

前面我们讲到：
jmp short 标号
jmp near ptr 标号
jcxz 标号
loop 标号
等几种汇编指令，它们对 IP的修改是根据转移目的地址和转移起始地址之间的位移来进行的。在它们对应的机器码中不包含转移的目的地址，而包含的是到目的地址的位移距离。
如果loop s的机器码中包含的是s的地址，则就对程序段在内存中的偏移地址有了严格的限制；

因为机器码中包含的是 s 的地址，如果 s 处的指令不在目的地址处，程序的执行就会出错。
而loop s的机器码中包含的是转移的位移，就不存在这个问题了；

因为，无论 s处的指令的实际地址是多少，loop指令的转移位移是不变的。

9.10 编译器对转移位移超界的检测
越界的话编译不通过