第九章 转移指令的原理

8086CPU的转移指令分为以下几类:
无条件转移指令 (如:jmp)
条件转移指令
循环指令(如:loop)
过程
中断

9.1 操作符offset----------伪指令

操作符offset在汇编语言中是由编译器处理的符号,它的功能是取得标号的偏移地址。
比如下面的程序:
assume cs:codesg
codeseg segment

    start:mov ax,offset start ; 相当于 mov ax,0
         s:mov ax,offset s      ; 相当于mov ax,3
  codesg ends
  end start

assume cs:codesg
codesg segment
s: mov ax,bx ;(mov ax,bx 的机器码占两个字节)
mov si,offset s
mov di,offset s0
mov ax,cs:[si]
mov cs:[di],ax
s0: nop ;(nop的机器码占一个字节)
nop
codesg ends
ends

9.2 jmp指令

jmp为无条件转移,可以只修改IP,也可以同时修改CS和IP;

jmp指令要给出两种信息:
转移的目的地址
转移的距离(段间转移、段内短转移,段内近转移)

9.3 依据位移进行转移的jmp指令

jmp short 标号(转到标号处执行指令)

这种格式的 jmp 指令实现的是段内短转移,它对IP的修改范围为 -128~127,也就是说,它向前转移时可以最多越过128个字节,向后转移可以最多越过127个字节。
比如:程序9.1
assume cs:codesg
codesg segment
start:mov ax,0
jmp short s
add ax,1
s:inc ax
codesg ends
end start

程序执行后, ax中的值为 1 ,因为执行 jmp short s 后 ,越过了add ax,1 ,IP 指向了标号 s处的 inc ax。也就是说,程序只进行了一次ax加1操作。
我们可以看到,Debug 将 jmp short s 中的 s 表示为inc ax 指令的偏移地址 8 ,并将jmp short s 表示为 jmp 0008 ,表示转移到cs:0008处。

但是我们观察对应的机器码,却意外地发现了一些问题……
jmp 0008 ( Debug 中的表示)或jmp short s (汇编语言中的表示)所对应的机器码为EB 03,注意,这个机器码中竟不包含转移的目的地址。

这意味着,CPU 在执行EB 03的时候,并不知道转移目的地址。
那么,CPU根据什么进行转移呢?

没有了目的地址,CPU如何知道转移到哪里呢?

我们做下小小的修改~
加一段代码之后
机器码变成了 EB 05
这说明在机器指令中并不包含转移的目的地址。

如果机器指令中不包含目的地址的话,那么,也就是说 CPU不需要这个目的地址就可以实现对IP的修改。

小B可能会问:“老师,那么具体是如何修改的呢?”

jmp short s指令的读取和执行过程:
(1)(CS)=0BBDH,(IP)=0006,CS:IP指向EB 03(jmp short s的机器码);
(2)读取指令码EB 03进入指令缓冲器;
(3)(IP)=(IP)+所读取指令的长度=(IP)+2=0008,CS:IP指向add ax,1;
(4)CPU指行指令缓冲器中的指令EB 03;
(5)指令EB 03执行后,(IP)=000BH,CS:IP指向inc ax。
实际上,指令“jmp short 标号”的功能为(IP)=(IP)+8位位移。
(1)8位位移=“标号”处的地址-jmp指令后的第一个字节的地址;
(2)short指明此处的位移为8位位移;
(3)8位位移的范围为-128~127,用补码表示
(如果你对补码还不了解,请阅读附注2)
(4)8位位移由编译程序在编译时算出。

还有一种和指令“jmp short 标号”功能相近的指令格式:
jmp near ptr 标号
它实现的时段内近转移。

指令“jmp near ptr 标号”的功能为:
(IP)=(IP)+16位位移。

指令“jmp near ptr 标号”的说明:
(1)16位位移=“标号”处的地址-jmp指令后的第一个字节的地址;
(2)near ptr指明此处的位移为16位位移,进行的是段内近转移;
(3)16位位移的范围为
-32769~32767,用补码表示;
(4)16位位移由编译程序在编译时算出。


9.4 转移的目的地址在指令中的jmp指令

前面讲的jmp指令,其对应的机器码中并没有转移的目的地址,而是相对于当前IP的转移位移。

指令 “jmp far ptr 标号”
实现的是段间转移,又称为远转移。
指令 “jmp far ptr 标号” 功能如下:
(CS)=标号所在段的段地址;
(IP)=标号所在段中的偏移地址。
far ptr指明了指令用标号的段地址和偏移地址修改CS和IP。

我们看下面的程序
assume cs:codesg
codesg segment
start:mov ax,0
mov bx,0
jmp far ptr s
db 256 dup (0)
s: add ax,1
inc ax
codesg ends
end start
源程序中的db 256 dup (0),被Debug解释为相应的若干条汇编指令 。这不是关键,关键是,我们要注意一下jmp far ptr s所对应的机器码:EA 0B 01 BD 0B ,其中包含转移的目的地址。
“0B 01 BD 0B” 是目的地址在指令中的存储顺序,高地址的“BD 0B”是转移的段地址:0BBDH,低地址的“0B 01” 是偏移地址:010BH。


9.5 转移地址在寄存器中的jmp指令

同时修改CS、IP的内容:
转移指令jmp 段地址:偏移地址
jmp 2AE3:3
jmp 3:0B16

功能:用指令中给出的段地址修改CS,偏移地址修改IP。
仅修改IP的内容:

jmp 某一合法寄存器
jmp ax (类似于 mov IP,ax)
jmp bx

功能:用寄存器中的值修改IP。


9.6 转移地址在内存中的jmp指令

转移地址在内存中的jmp指令有两种格式:

(1) jmp word ptr 内存单元地址(段内转移)
功能:从内存单元地址处开始存放着一个字,是转移的目的偏移地址。

内存单元地址可用寻址方式的任一格式给出。

mov ax,0123H
mov ds:[0],ax
jmp word ptr ds:[0]
执行后,(IP)=0123H

mov ax,0123H
mov [bx],ax
jmp word ptr [bx]
执行后,(IP)=0123H

(2) jmp dword ptr 内存单元地址(段间转移)

功能:从内存单元地址处开始存放着两个字,高地址处的字是转移的目的段地址,低地址处是转移的目的偏移地址。
	(CS)=(内存单元地址+2)
	(IP)=(内存单元地址)
内存单元地址可用寻址方式的任一格式给出。

mov ax,0123H
mov ds:[0],ax
mov word ptr ds:[2],0
jmp dword ptr ds:[0]

执行后,
(CS)=0
(IP)=0123H
CS:IP 指向 0000:0123。

mov ax,0123H
mov [bx],ax
mov word ptr [bx+2],0
jmp dword ptr [bx]

执行后,
(CS)=0
(IP)=0123H
CS:IP 指向 0000:0123。

9.7 jcxz指令

jcxz指令为有条件转移指令,所有的有条件转移指令都是短转移,在对应的机器码中包含转移的位移,而不是目的地址。对IP的修改范围都为-128~127。

指令格式:jcxz 标号
(如果(cx)=0,则转移到标号处执行。)

jcxz 标号 指令操作:
当(cx)=0时,(IP)=(IP)+8位位移)
8位位移=“标号”处的地址-jcxz指令后的第一个字节的地址;
8位位移的范围为-128~127,用补码表示;
8位位移由编译程序在编译时算出。

当(cx)≠0时,什么也不做(程序向下执行)。

我们从 jcxz的功能中可以看出,指令“jcxz 标号”的功能相当于:
if((cx)==0)
jmp short 标号;

(这种用C语言和汇编语言进行的综合描述,或许能使你对有条件指令理解得更加清楚。)

补全编程,利用jcxz指令,实现在内存2000H段中找查第一个值为为0的字节,找到后,将它的偏移地址存储在dx中。
assume cs:code
code segment
start: mov ax,2000H
mov ds,ax
mov bx,0
s: mov ch,0
mov cl,[bx]
jcxz ok
inc bx
jmp short s
ok: mov dx,bx
mov ax,4c00h
int 21h
code ends
end start

9.8 loop指令

loop指令为循环指令,所有的循环指令都是短转移,在对应的机器码中包含转移的位移,而不是目的地址。

对IP的修改范围都为-128~127。

指令格式:loop 标号
((cx))=(cx)-1,如果(cx)≠0,转移到标号处执行。
loop 标号 指令操作:
(1)(cx)=(cx)-1;
(2)如果(cx)≠0,(IP)=(IP)+8位位移。
8位位移=“标号”处的地址-loop指令后的第一个字节的地址;
8位位移的范围为-128~127,用补码表示;
8位位移由编译程序在编译时算出。

当(cx)=0,什么也不做(程序向下执行)。

我们从loop的功能中可以看出,指令“loop 标号”的功能相当于:

(cx)--;
if((cx)≠0)
jmp short 标号

补全程序,利用loop指令,实现在内存2000H段中查找第一个值为0的字节,找到后,将它的偏移地址存储在dx中。

assume cs:code
code segment
start: mov ax,2000h
mov ds,ax
mov bx,0
s: mov cl,[bx]
mov ch,0
inc cx
inc bx
loop s
ok: dec bx
mov dx,bx
mov ax,4c00h
int 21h
code ends
end start

9.9 根据位移进行转移的意义

前面我们讲到:
jmp short 标号
jmp near ptr 标号
jcxz 标号
loop 标号
等几种汇编指令,它们对 IP的修改是根据转移目的地址和转移起始地址之间的位移来进行的。在它们对应的机器码中不包含转移的目的地址,而包含的是到目的地址的位移距离。

前面我们讲到:
jmp short 标号
jmp near ptr 标号
jcxz 标号
loop 标号
等几种汇编指令,它们对 IP的修改是根据转移目的地址和转移起始地址之间的位移来进行的。在它们对应的机器码中不包含转移的目的地址,而包含的是到目的地址的位移距离。
如果loop s的机器码中包含的是s的地址,则就对程序段在内存中的偏移地址有了严格的限制;

因为机器码中包含的是 s 的地址,如果 s 处的指令不在目的地址处,程序的执行就会出错。
而loop s的机器码中包含的是转移的位移,就不存在这个问题了;

因为,无论 s处的指令的实际地址是多少,loop指令的转移位移是不变的。

9.10 编译器对转移位移超界的检测
越界的话编译不通过



原文地址:https://www.cnblogs.com/poli/p/4667197.html