前言
最近对汇编语言突然产生了兴趣,汇编作为一个与计算机交互的底层的语言,能够做到很多高级语言无法完成的事情,所以决定自学一下汇编。
因为汇编语言看起来对人并不友好,涉及的指令和寄存器很多,容易混淆,易忘,希望可以坚持下来,可以认识汇编语言,能够很好的运用。
寄存器
寄存器是cpu内部的物理存储单元,对于CPU来说可以当成一些临时变量,用于临时存放数据,众所周知,寄存器的读取虽度比内存快的多,所以在编写汇编程序的时候,要尽可能的充分利用寄存器,寄存器一般用来保存程序运行的中间结果,从而为后面执行的指令卡哀诉提供操作数,从而避免中间结果存入内存,再读取内存的操作。另外我们要注意的是,因为计算机系统有32位和64位的分别,寄存器也是如此,也就是说寄存器能够存放的数据的长度是有限的,再加上计算机中寄存器的个数也是有限的,我们在使用寄存器的时候也要注意合理使用,这样才能达到我们想要的高效。
寄存器的分类
32位寄存器
- 4个数据寄存器 EAX,EBX,ECX,EDX
- 2个堆栈指针寄存器 ESP,EBP
- 2个数据指针寄存器 ESI,EDI
- 1个标志寄存器 EFlags
- 1个指令指针寄存器 EIP
- 6个数据段寄存器 ES,CS,SS,DS,FS,GS
16位寄存器
- 4个数据寄存器 AX,BX,CX,DX
- 2个堆栈指针寄存器 SP,BP
- 2个数据指针寄存器 SI,DI
- 1个标志寄存器 Flags
- 1个指令指针寄存器 IP
- 6个数据段寄存器 ES,CS,SS,DS,FS,GS
8位寄存器
-
8个数据寄存器 AH,AL,BH,BL,CH,CL,DH,DL
同时一些32位寄存器里又包含着16位寄存器,16位寄存器里又包含着两个8位寄存器,事实上32位程序都是直接使用32位的内存地址,所以上述的多个16位寄存器除AX,BX,CX,DX外基本上都用不到的,在32位的保护模式下段寄存器更是用不到了。
通用寄存器的作用
通用寄存器用户传送和存放数据,也可以参与算术逻辑运算,并保存运算结果,他们还各自具有一些特殊功能。
1.数据寄存器
数据寄存器主要用来保存操作数和运算结果等信息,从而节省读取操作数所需占用总线和访问存储器的时间。
32位 CPU 有4个32位的通用寄存器 EAX , EBX , ECX , EDX .对低16位数据的存取,不会影响高16位的数据.这些低16位寄存器分别命名为: AX , BX , CX , DX .它和先前的 CPU 中的寄存器相一致。
4个16位寄存器又可分割成8个独立的8位寄存器( AX:AH - AL , BX:BH - BL , CX:CH - CL , DX:DH - DL ),每个寄存器都有自己的名称,可独立存取。程序员可利用数据寄存器的这种“可分可合”的特性,灵活地处理字/字节的信息。
寄存器 EAX,AX,AL 通常称为累加器(Accumulator),用累加器进行的操作可能需要更少时间.累加器可用于乘、除、输入/输出,汇编子程序返回值等操作,它们的使用频率很高;
寄存器 EBX,BX 称为基地址寄存器(Base Register)。它可作为存储器指针来使用;
寄存器 ECX,CX 称为计数寄存器(Count Register)。在循环和字符串操作时,要用它来控制循环次数;在位操作中,当移多位时,要用 CL 来指明移位的位数;
寄存器 EDX,DX 称为数据寄存器(Data Register)。在进行乘、除运算时,它可作为默认的操作数参与运算,也可用于存放 I/O 的端口地址。
32位寄存器 EAX , EBX , ECX , EDX 不仅可传送数据、暂存数据保存算术逻辑运算结果,而且也可作为指针寄存器.
2.变址寄存器
32位 CPU 有2个32位通用寄存器 ESI 和 EDI 。
寄存器 ESI , EDI 称为变址寄存器(Index Register),它们主要用于存放某些内存数据所在的内存地址
作为通用寄存器,也可存储算术逻辑运算的操作数和运算结果。
它们可作一般的存储器指针使用。在字符串操作指令的执行过程中,对它们有特定的要求,而且还具有特殊的功能。
3 .指针寄存器
32位 CPU 有2个32位通用寄存器 EBP 和 ESP 。
寄存器 EBP , ESP 称为指针寄存器(Pointer Register),主要用于存放堆栈内存储单元的偏移量.用它们可实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。
指针寄存器不可分割成8位寄存器。作为通用寄存器,也可存储算术逻辑运算的操作数和运算结果。
它们主要用于访问堆栈内的存储单元,并且规定:
ESP为堆栈指针(Stack Pointer)寄存器,用它只可访问栈顶。
EBP为基指针(Base Pointer)寄存器,用它可直接存取堆栈中的数据;
一般EBP指向的栈中数据是当前汇编子程序执行到返回时,要跳向的指令地址.
标准的汇编子程序里常见的用[ebp+8]=子程序参数1 ,[ebp+c]=子程序参数2 ,[ebp-4]=局部整数型变量1,[ebp-8]=局部整数型变量2,以此类推。
4.段寄存器
CS——代码段寄存器(Code Segment Register),其值为代码段的段值;
DS——数据段寄存器(Data Segment Register),其值为数据段的段值;
ES——附加段寄存器(Extra Segment Register),其值为附加数据段的段值;
SS——堆栈段寄存器(Stack Segment Register),其值为堆栈段的段值;
FS——附加段寄存器(Extra Segment Register),其值为附加数据段的段值;
GS——附加段寄存器(Extra Segment Register),其值为附加数据段的段值。
事实上我们的软件都是运行在CPU的保护模式下,这些段寄存器基本已经用不到了,所以也无需去详细了解它,不知道为什么的可以了解一下cpu的实模式和保护模式,说白了就是寻址方式的改变从<段:偏移地址>变成了页表式。
5.指令指针寄存器
指令指针 EIP (Instruction Pointer)是存放下次将要执行的汇编指令所在的内存地址。在具有预取指令功能的系统中,下次要执行的指令通常已被预取到指令队列中,除非发生代码流程转移情况。所以,在理解它们的功能时,不考虑存在指令队列的情况。
这个EIP指令指针寄存器,只需知道它是将要被执行的下一条汇编指令的内存地址即可.除非当前在执行的这条指令会跳到别处.而且我们也不能直接读取或赋值EIP寄存器中的值。
标志寄存器的作用
32 位 CPU 内部有一个 32 位的标志寄存器,它包含 13 个标志位。这些标志位主要用来反映处理器的状态和运算结果的某些特征。各标志位在标志寄存器内的分布如下图所示。
31 |
… |
17 |
16 |
15 |
14 |
13 |
12 |
11 |
10 |
9 |
8 |
7 |
6 |
5 |
4 |
3 |
2 |
1 |
0 |
|
|
VM |
RF |
|
NT |
IOPL |
OF |
DF |
IF |
TF |
SF |
ZF |
|
AF |
|
PF |
|
CF |
32位标志寄存器的示意图
上面13个标志位可分为二组:运算结果标志位(有 背景色 的标志位)和状态控制标志位。前者受 算术运算 和 逻辑运算 结果的影响,后者受一些控制指令执行的影响。
有些指令的执行会改变标志位(如:算术运算指令等),不同的指令会影响不同的标志位,有些指令的执行不改变任何标志位(如: MOV 指令等),有些指令的执行会受标志位的影响(如:条件转移指令等),也有指令的执行不受其影响。
程序员要想熟练运用这些标志位,就必须掌握每个标志位的含义,每条指令的执行条件和执行结果对标志位的作用。
注意 :虽然知道每个标志位在标志寄存器内的具体位置是有好处的,但通常情况下,没有这个必要.在后面的“ 条件转移指令 ”时,系统会自动引用相应标志位的值来决定是否需要“转移”的,所以不必过分强调标志位在标志寄存器内的具体位置。
运算结果标志位
1.进位标志CF
进位标志CF主要用来反映运算是否产生进位或借位.如果运算结果的最高位产生了一个进位或借位,那么其值为1,否则其值为0。使用该标志位的情况有:多字(字节)数的加减运算,无符号数的大小比较运算,移位操作,字(字节)之间移位,专门改变CF值的指令等。
2.奇偶标志PF
奇偶标志PF用于反映运算结果中“1”的个数的奇偶性。如果“1”的个数为偶数,则PF的值为1,否则其值为0。利用PF可进行奇偶校验检查,或产生奇偶校验位.在数据传送过程中,为了提供传送的可靠性,如果采用奇偶校验的方法,就可使用该标志位。
3.辅助进位标志AF
在发生下列情况时,辅助进位标志AF的值被置为1,否则其值为0:
(1)、在字操作时,发生低字节向高字节进位或借位时;
(2)、在字节操作时,发生低4位向高4位进位或借位时。
对以上6个运算结果标志位,在一般编程情况下,标志位CF、ZF、SF和OF的使用频率较高,而标志位PF和AF的使用频率较低。
4.零标志ZF
零标志ZF用来反映运算结果是否为0.如果运算结果为0,则其值为1,否则其值为0.在判断运算结果是否为0时,可使用此标志位。
5.符号标志SF
符号标志SF用来反映运算结果的符号位,它与运算结果的最高位相同.在微机系统中,有符号数采用补码表示法,所以,SF也就反映运算结果的正负号.运算结果为正数时,SF的值为0,否则其值为1.
6.溢出标志
溢出标志OF用于反映有符号数加减运算所得结果是否溢出.如果运算结果超过当前运算位数所能表示的范围,则称为溢出,OF的值被置为1,否则OF的值被清为0。
“溢出”和“进位”是两个不同含义的概念,不要混淆。
还有很多的标志位在这里就不记录了,比如状态控制标志位等,不是特殊情况基本不常用,以上的标志位都是会用来跟“条件转移”关联的,使用频繁。
下一节学习一下操作数的寻址方式。自学汇编(二) 操作数寻址方式