CPU对软件调试的支持(三)

两期我们分别介绍了通过 INT3指令设置的软件断点和通过调试寄存器设置的硬件断点。除了断点 . 还有一类常用的方法使C P U 中断到调试器 . 这便是调试陷阱标志 (debug trap f l a g ) 。也就是当这些陷阱标志被设置时，一旦有符合陷阱条件的事件发生，就会陷入到调试器。 IA 一3 2 处理器所支持的调试陷阱标志可以概括如下

80866就支持的单步执行标志 (标志寄存器E F a g I s 的一位)
3 8 6 引入的任务状态陷阱标志(任务状态段TSS 的T标志)
奔腾Pro引入的分支到分支单步执行标志 (D e b u gC t !寄存器中的BT F 标志)

下面分别详细介绍。

单步执行标志 (T F )

从 8 0 8 6 C pU 开始 , x 86 系列处理器的标志(EF Ia g s ) 寄存器中便有一个陷阱标志位 ( b i t 8 )名为Trap Flag 简称T F。当 T F 位为 1 时 CPU 每执行完一条指令便会产生一个调试异常《# DB ) . 中断到调试器的调试异常处理程序。这就是通常所说的单步执行。调试异常的向量号是 1 因此 T F 标志引发的是 1 号异常服例程。在 80 86 和 2 8 6 时代 , 这个服务例程是专门用来处理单步事件的。从 3 8 6 开始 . 硬件断点发.生时也会产生调试异常 . 调用 1 号服务例程 . 但可利用调试状态寄存器（DR66 ) 来识别发生的是何种事件。为了表达方便我们把因 T F标志触发的软件异常称为单步异常。

单步异常属于陷阱类异常。也就是 C P U 总是在执行完导致此类异常的指令后才产生该异常。这意味着当因单步异常中断到调试器中时，导致该异常的指令已经执行完毕了。软件断点异常(#BP) 和硬件断点中的数据及I/O 断点也是陷阱类异常. 但是硬件断点中的指令访问异常是错误类异常 . 也就是当由于此异常而中断到调试器时 . 相应调试地址寄存器 DRn中所指地址处的指令还没“执行。这是因为CPU是在取指操作时进行此类断点匹配的。

CPU是何时检查 TF标志的呢?’IA-32手册的原文是 "while an instruction is begin executed" 也就是在执行一个指令的过程中。尽管没有说过程中的哪个阶段 (开始、中间还是末尾 ) . 可以推测应该是一条指令即将执行完毕的时候。也就是说当CPU在将执行完一条指令的时候检测TF位 ,如果该位为 1那么 CPU会先清除此位 , 然后准备产生异常。但是这里有个例外 , 对于那些可以设置 TF 位的指令 (例如 POPF) CPU 不会在执行这些指令期间做以上检查。也就是说这些 ,旨令不会立刻产生单步异常 . 而是其后的下一条指令将产生单步异常。
因为 C P U 在进入异常处理例程前会自动清除 T F标，因此当 CPU中断到调试器中后再观察 TF标志 . 它总是0。

既然调试异常的向量号是 1 ,可不可以像 INT 3 那样通过在代码中插入INT 1 这样的指令来实现手工断点呢 , 对于应用程序答案是否定的。 INT 3尽管具有INTn的形式 . 但是它具有独特的单字节机器码 . 而且其作用就是产生一个断点异常一(#BP ) 。因此系统对其有特别的对待 .允许其在用户模式下执行。而 INT 1则不然，它属于普通的 INTn 指令机器码为 CD01。保护模式下如果执行 INTn指令时,当前的 CPL大于引用的门描述符的DPL。那么便会导致通用保护异常 (# GP) 。在 W id n o w s 20 0 0 和 x p 这样的操作系统下，INT1对用的中断门描述符的DPL 为 0 . 这要求只有内核模式的代码才能执行 IN T 1指令，访问该中断门。也就是说 , 用户模式下的应用程序没有权利使用INT 1指令。一旦使用就会导致一个一般保护性异常 ( # GP) 。W id n o w s会将其封装为一个访 `问违例错误 (如图2一 2 1 所示 )。在内核模式下可以在代码 (驱动程序)中写入INT 1指令。CP U 执行到该指令时会转去执行 1号向量对应的处理例程 , 如果在使用 W in D g b 进行内核级调试. 那么会中断到W i n o b g 中 . W i n o b g 会以为是发生了一个单步异常如图 1 所示。

下面谈谈调试高级语言时的单步机制。由于高级语言的一条语句通常都对应多条汇编指令例如 , 表 1 中C+ 十的一条语句= i a 十b* “ + d / e + f / g 十 h对应于 1 5 条汇编语句。因此容易想到单步执行这条C+ + 语句有几种可能方法。一种是也用一标志一步步的走过每条汇编指令 , 这种方法意味着会产生 1 5 次调试异常 . CPU 中断到调试器 1 5 次.不过中间的 1 4 次都是简单的重新设皿起下F 标志便让 CPU返回执行。第二种方法是在 C + + 语句对应的最后一条汇编指令处动态插入一条lN 下 3指令 . 让C P U 一下子跑到那里然后再单步执行一次将被替换的那条指令执行完 . 这种方法需要 CPU中断到调试器两次。第三种方法是在这条 C++ 语句的下一条语句的第一条汇编指令处( 即行 18 ) 替换入一个 N I 下 3 . 这样 C PU 中断到调试器一次就可以了。
表 1 : 高级语言的单步执行

后两种方法较第一种方法速度会快很多 . 但是不幸的是并不总能正确的预测出最后高级语言对应的最后一条指令和下一行语句开始指令 (要替换为INT 3 的那一条指令)。比如 2 8 行的 e l s e if (b ) 语句就很难判断出它对应的最后一条汇编语句和下一条高级语言语句的起始指令。因此今天的大多数调试器在进行高级语言调试时都是使用第一种方法来实现单步跟踪的。关于 TF标志还有一点值得注意： . INTn 和 INTO 指令会清除TF标志 , 因此调试器在单步跟踪这些指令时 . 必须做特别处理。

任务状态陷阱标志

除了标志寄存器中的陷阱标志 (TF ) 位.38 6 引入了一种新的调试陷阱标志任务状态段 (TSS ) 中的T标志。任务状态段 (Ta s k一S t a te S e g m e n t ) 用来记录一个任务 (CPU 可以独立调度和执行的程序段 ) 的状态 . 包括通用寄存器的值 . 段寄存器的值和其它重要信息。在任务切换时 , 当前任务的状态会被保存到这个内存段里。当要恢复执行这个任务时 . 会先根据这个记录来把寄存器的值恢复回来。 T S S 中 , 在宇节偏移为 10 0 的 1 6 位字 (w o r d ) 的最低位是调试陷阱标志位 . 简称 T标志。 T 标志被设置为 1，那么当CPU切换到这个任务时 , 便会产生调试异常。准确的说CPU 是在程序控制权已经转移到新的任务 , 但还没有开始执行新任务的第一条指令前产生异常的。调试中断处理程序可以通过调试状态寄存器 (DR6 ) 的 BT来识别出发生的是否是任务切换异常。值得注意的是 . 如果调试器接管了调试异常处理 . 而且该处理例程属于一个独立的任务 , 那么一定不要设置该任务的TSS段中的 T位。否则便会导致死循环。

分支到分支单步执行标志 ( B T F )

在 lA 一 3 2 处理器家族中 , 所有的 P e n i t u m Pr o Pe n t l u m II和 Pe n t . u m III处理器 (包括相应的 C e .e r o n 《赛扬 ) 和 X e o n (至强 ) 版本) 因为都是基于相同的 6 P 内核《C o r e ) . 因此经常被统称为P6处理器。 P6处理器引入了一项新的对调试非常有用的功能 : 记录分支、中断和异常事件 . 和针对分支单步执行(s in g le 一s z e p o n b r a n e h ) 的功能。奔腾 4 处理器对这一功能又做了很大增强。下面具体介绍一下按分支单步执行的功能和使用方法。
首先解释一下分支到分支单步执行的含义。前面我们介绍过 , 当 ElF a g s 寄存器的T F 位为 1 时 C PU 每执行完一条指令便会中断到调试器 . 也就是以指令为单位单步执行。顾名思义, 针对分支单步执行就是以分支为单位单步执行。换句话说 , 每单步 ( s t ep ) 一次 C P U 会一直执行到有分支、中断或异常发生。下面结合表 2 中的代码进行说明。
那么如何启用按分支单步执行呢? 简单来说 . 就是要同时设置TF和BTF 标志。TF 标志位干 E F Ia g s寄存器, 大家已经很熟悉。 BTF 标志位于名为DebugCtlMSR 寄存器中。

在V C6 的ID E 环境下(系统的 C PU 应该是 P6 或更高 ),先在第 2 2 行设置一个断点 . 然后按F5 运行到这个断点位置。行 1 9是用来启用按分支单步执行功能的 . 也就是设置BTF 标志. 细节我们等一下再讲。接下来 . 我们按 F10单步执行 , 会发现一下子会执行到行 3 1 . 从第 2 2 行单步一次执行到第 3 1 行这便是按分支单步执行的效果。那么为什么会执行到第 3 1 行呢? 按照分支到分支单步执行的定义 , CP U 会在执行到下一次分支、中断或异常发生时停止。对于我们的例子 . CP U 在执行第 2 0 行对应的第一条汇编指令时 , CP U 会检测到 TF 标志 (因为我们是按F10单步执行 . 所以 VC 6 会帮助我们设置TF 标志)。

此外 ,P6及以后的 lA 一 3 2 CP U 还会检变 BTF 标志 . 当发现BTF标志也被设置起时， C P U会认为当前是在按分支单步执行 . 所以会判断当前指令是否是分支指令 , 如果不是，CP U 便会继续执行。因为第 2 2 行的第一条汇编指令不是分支指令 . 所以 CP U 会继续执行。依次类推 . CP U 会连续执行到第 2 4 行的 i f 语句对应的最后一条汇编指令jne (参见表 3 )。因为这条语句是分支语句 ,所以 CPU会认为已经满足停止执行的条件 , 在清除 , TF 和BTF标志后,产生单步异常中断到调试器。中断到调试器时 . 分支语句已经执行完毕 , 但是跳转到的那条语句 (即表 2 中的行 3 1 } 还没有执行。

对以上过程还有有几点需要说明:

第一如果在从第 2 2 行执行到 2 4 行过程中,有中断或异常发生 , 那么 C P U 也会认为停止单步执行的条件已经满足. 因此按分支单步执行的全称是按分支、异常和中断单步执行。

第二 , CPU 认为有分支发生的条件是执行以下分支指令 :JM P (无条件跳转), JCC (包括条件跳转指令 , 如 J A 、 J A E、 JNE等等)、L OO P (循环 ) 和 Call（函数 / 过程调用 ) 。

第三 , 由于只有内核代码才能访问MS R 寄存器 (通过RDMSR 和四WRMSR 指令) 所以上面的例子中 , 在 WriteMSR（）函数中我们使用一个未公开的 A p l ZwSystemDebugControl（）来设置 BTF 标志。