高级语言反汇编程序的函数调用过程Jim Chan10/25/2001查看:字体:宋体 字形:常规 大小:小五 字符集:CHINESE_GB2312━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
摘要:本文说明高级语言编译成汇编语言后,高级语言中函数调用的汇编程序过程。
正文:高级语言编译成汇编程序以后,在高级语言中的函数调用的汇编程序过程如下:
1.将函数参数入栈,第一个参数在栈顶,最后一个参数在栈底。
2.执行CALL指令,调用该函数,进入该函数代码空间。a.执行CALL指令,将CALL指令下一行代码的地址入栈。b.进入函数代码空间后,将基址指针EBP入栈,然后让基址指针EBP指向当前堆栈栈顶,并使用它访问存在堆栈中的函数输入参数及堆栈中的其他数据。c.堆栈指针ESP减少一个值,如44H,向上移动一个距离,留出一个空间给该函数作为临时存储区。{ // 以上准备工作做好后,函数正式被执行,如下所示。 d.将其他指针或寄存器中的值入栈,以便在函数中使用这些寄存器。 e.执行代码。 f.执行return()返回执行结果,将要返回的值存入EAX中。 g.步骤2.d中的指针出栈。}h.将EBP的值传给堆栈指针ESP,使ESP复原为2.c之前的值。此时进入函数时EBP的值在栈顶。i.基址指针EBP出栈,复原为2.b之前的EBP的值。j.执行RET指令,“调用函数”的地址出栈,本函数返回到CALL指令的下一行。
3.函数返回到CALL指令下一行,将堆栈指针加一个数值,以使堆栈指针恢复到以上步骤1执行之前的值。该数值是上面第一步入栈参数的总长度。
注意:1.堆栈指针ESP指向栈顶的新入栈数据的最低位。2.MOV指令中偏移指针指向被“MOV”的数据的最低位。如下面指令是将ebp+8到ebp+11四个字节的内容传到eax寄存器中。00402048 mov eax,dword ptr [ebp+8]
一个例子如下:
高级语言代码中的函数调用如下:
117: bR = t1(p);
汇编代码如下:
00401FB8 mov ecx,dword ptr [ebp-8] ;将参数放入ecx寄存器00401FBB push ecx ;参数入栈00401FBC call @ILT+10(t1) (0040100f) ;函数调用,下一行地址00401FC1入栈00401FC1 add esp,4 ;函数返回,堆栈指针加4,复原为00401FB8时的值00401FC4 mov dword ptr [ebp-10h],eax ;从eax中取出高级语言中的函数返回值,放入bR变量中
其中t1函数如下:
125: BOOL t1(void* p)126: {00402030 push ebp ;ebp入栈00402031 mov ebp,esp ;ebp指向此时堆栈的栈顶00402033 sub esp,44h ;esp减少一个值,空出一段存储区00402036 push ebx ;将三个寄存器的值入栈,以便在函数中使用它00402037 push esi ;00402038 push edi ;00402039 lea edi,[ebp-44h] ;0040203C mov ecx,11h ;00402041 mov eax,0CCCCCCCCh ;00402046 rep stos dword ptr [edi] ;127: int* q = (int*)p; ;00402048 mov eax,dword ptr [ebp+8] ;ebp+8指向函数输入参数的最低位地址;;如果是ebp+4则指向函数返回地址00401FC1的最低位,值为C10040204B mov dword ptr [ebp-4],eax ;128: return 0; ;0040204E xor eax,eax ;返回值放入eax寄存器中129: }00402050 pop edi ;三个寄存器出栈00402051 pop esi ;00402052 pop ebx ;00402053 mov esp,ebp ;esp复原00402055 pop ebp ;ebp出栈,它的值也复原了00402056 ret ;返回到此时栈顶存储的代码地址:00401FC1;故而如果不幸被修改了返回地址,程序就会出现意外
以上汇编代码由VC++6.0编译得到。
堆栈在EBP入栈后的情况:
低位 高位 ↓ ↓内存地址 堆栈 ┆ ┆0012F600├──────┤← edi = 0012F600 │ │0012F604├─┄┄┄┄─┤ │ │ │ │ ┆ 44h的空间 ┆ ┆ ┆ │ │ │ │0012F640├─┄┄┄┄─┤ │ │0012F644├──────┤← ebp被赋值后指向该单元,此时ebp=0012F644 │AC F6 12 00 │ebp赋值为esp之前的值0012F648├──────┤ │C1 1F 40 00 │返回地址0012F64C├──────┤← ebp + 8 │A0 F6 12 00 │函数实参p的值0012F650├──────┤ │ │ ├──────┤ ┆ ┆
注:存储器存储空间堆栈按从高到低的排列,左边标注的地址是其右下方存储单元的最低位地址。如0012F644指向0012F6AC的AC字节,AC在栈顶。图中存储器中的内容按从低到高位书写,“AC F6 12 00”= 0x0012F6AC