刘杰

状态：V2 新版首页今天正式上线！新版首页增加了内容容量；增加了站内搜索功能，支持相关搜索，热门搜索。

V2 改版今日上线成功！新版首页增加了内容容量；增加了站内搜索功能，支持相关搜索，热门搜索。

131 篇
博文总数 0 篇
近一月 0 篇
近一周

C/C++ 函数调用底层原理：从底层汇编语言角度分析X86 堆栈平衡与执行机制

分类：原创汇编语言标签：函数调用约定详解汇编语言相关

作者：刘杰
来源：技术那些事
阅读：747

发布： 2025-07-13 15:51
最后更新： 2025-07-13 15:51

堆栈平衡

寄存器的备份和恢复

assembly 复制

push	ebp; 栈基址备份
mov ebp, esp; 将当前的栈顶指针放到栈基址
; 前两句为保存上一层的调用堆栈
; 后两句为恢复上一层的调用堆栈
mov		esp, ebp	; 将当前栈基址恢复到栈顶
pop 	ebp			; 将之前保存的栈基址恢复

使用堆栈备份寄存器的有效前提是堆栈平衡，堆栈平衡也就是 esp 相同。

实际上，函数进入时，一般都会在栈上开辟一片用户保存内部变量的空间，从而导致 esp 的改变。因此，esp 是需要在开辟内部局部变量空间之前进行备份的。所以并不是压入堆栈，而是用 ebp 用于暂时的容身之处（如下代码）。当然，这中间同样有一个假定，就是在函数的执行过程中 ebp 的值不能被改变。如果改变了，esp 的值也就无从恢复了。这一点是由编译器进行保证的，编译器保证不会修改 ebp 的值，出现 mov ebp, xxx类似的代码，MS 的编译器会发出警告，当然这种保证是脆弱的，并不是强制的。如果在函数中修改了ebp 的值，又没有正确的恢复回来，则可能导致整个函数调用体系崩溃。

assembly 复制

mov ebp, esp; 将栈顶指针备份到 ebp
...
mov esp, ebp; 将栈基指针恢复到 esp

内部变量与返回值

局部变量的特点是使用完函数（函数返回）之后，变量就失效了。内部变量所在的空间叫做栈空间，是在堆栈中的。这样做有很多好处，比如多线程的时候，内部变量必须是不被多线程共享的。同时，windows 会为每个线程准备单独的堆栈。这一点很容易做到，只要在线程切换的同时也切换 esp 的值就可以了。所以，把内部变量放到堆栈里是最简单可行的了。

lea 指令的来历和使用，lea 指令的源操作数必须是内存操作数，在用户层面的内存地址都是逻辑地址：逻辑地址 = segment:offset，而 offset 就是逻辑地址中的有效地址。

lea 指令取的就是 offset 的值，也就是有效地址值，这个有效地址包括了 x86 体系的所有的内存寻址模式，比如 [eax]（寄存器间接寻址），[0x12345678]（直接内存寻址），[eax + ebx * 4 + 0x0c]（基址加变址寻址）。

assembly 复制

mov edi, ebp - 0D8h		; 这样的语句是不合法的，源操作数这里不能直接运算
lea edi, [ebp - 0D8h]	; 这是合法的.

一般 eax 用来容纳函数的返回值。

X86中函数的调用与返回

在 X86 架构中，函数的调用与返回是一个严格依赖堆栈机制和寄存器约定的过程，涉及参数传递、栈帧管理、返回地址处理等多个环节。结合前面提到的堆栈平衡和寄存器备份知识，我们可以进一步展开如下：

函数调用的完整流程

函数调用的过程可拆解为调用前准备、进入函数、函数执行、函数返回四个阶段，每个阶段都有明确的堆栈和寄存器操作逻辑。

调用前准备（调用者操作）

在调用函数前，调用者需要完成两件核心工作：

参数入栈：将函数所需的参数按特定顺序压入堆栈（X86 中通常是 “从右到左”，即最后一个参数先入栈）。
执行 call 指令：触发函数跳转，同时保存返回地址（即call指令的下一条指令地址）到栈中。

举例：调用int add(int a, int b)时，调用者的汇编可能为：

复制

push 2       ; 先压入第二个参数b（右到左）
push 1       ; 再压入第一个参数a
call add     ; 执行调用：压入返回地址，跳转到add函数入口

进入函数（被调用者操作）

函数被调用后，首先需要构建当前函数的栈帧（Stack Frame），用于隔离局部变量和上层函数的栈数据。栈帧的核心是通过ebp（栈基指针）固定栈结构，步骤如下：

备份上层 ebp：push ebp（将上层函数的栈基指针压栈保存）。
设置当前 ebp：mov ebp, esp（用当前栈顶指针esp初始化当前ebp，此时ebp成为当前栈帧的 “锚点”）。
开辟局部变量空间：sub esp, N（通过减小esp在栈上预留 N 字节空间，用于存储局部变量）。

此时栈的结构（从高地址到低地址）如下：

地址偏移（相对于ebp）	内容	说明
ebp+8	参数 a（1）	第一个参数（距离ebp最近）
ebp+0xC	参数 b（2）	第二个参数
ebp+4	返回地址	call指令压入的地址
ebp	上层ebp的值	保存的上层栈基指针
ebp-4 ～ ebp-N	局部变量	sub esp, N开辟的空间

函数执行（被调用者操作）

函数执行过程中，所有局部变量的访问都基于当前ebp的偏移（如[ebp-4]访问第一个局部变量），参数访问则基于ebp的正偏移（如[ebp+8]访问参数 a）。

同时，需遵守寄存器使用约定：

被调用者需保护的寄存器（callee-saved）：ebx、esi、edi、ebp（若函数中使用这些寄存器，需先push保存，退出前pop恢复）。
调用者需保护的寄存器（caller-saved）：eax、ecx、edx（被调用者可随意修改，调用者若需保留需自行备份）。

举例：add函数执行加法的汇编可能为：

复制

add:
    push ebp        ; 备份上层ebp
    mov ebp, esp    ; 初始化当前ebp
    sub esp, 4      ; 开辟4字节局部变量空间（存储a+b的结果）
    ; 计算a+b
    mov eax, [ebp+8]  ; 取参数a到eax
    add eax, [ebp+0xC] ; 加参数b
    mov [ebp-4], eax  ; 结果存入局部变量
    ; 准备返回值（X86中用eax传递返回值）
    mov eax, [ebp-4]  ; 将结果放入eax

函数返回（被调用者 + 调用者操作）

函数执行完毕后，需销毁当前栈帧并返回，步骤如下：

恢复 esp：mov esp, ebp（通过ebp将esp复位到栈帧起始位置，释放局部变量空间）。
恢复上层 ebp：pop ebp（将栈中保存的上层ebp恢复，回到上层栈帧）。
执行 ret 指令：从栈中弹出返回地址并跳转（即pop eip，eip为指令指针寄存器）。

此外，需根据调用约定清理栈上的参数（避免堆栈失衡）：

若为 cdecl 约定（C 语言默认）：由调用者清理参数（add esp, 8，8 字节对应两个int参数）。
若为 stdcall 约定（Windows API 常用）：由被调用者清理参数（ret 8，ret指令同时加esp释放参数空间）。

举例：add函数的返回部分（cdecl约定）：

复制

mov esp, ebp    ; 恢复esp，释放局部变量
pop ebp         ; 恢复上层ebp
ret             ; 弹出返回地址，跳转回调用者
; 调用者后续清理参数：
add esp, 8       ; 清理栈上的a和b（共8字节）

关键指令与机制解析

call指令的作用

call 函数地址的本质是两步操作：

复制

push eip_next   ; 将下一条指令地址（返回地址）压栈
jmp 函数地址    ; 跳转到函数入口

这保证了函数执行完毕后能回到正确的位置继续执行。

ret指令的作用

ret指令的本质是：

复制

pop eip         ; 从栈顶弹出返回地址，赋值给eip（指令指针）

若为ret N（如ret 8），则额外执行add esp, N，用于被调用者清理参数（stdcall约定）。

堆栈平衡的核心

整个过程中，esp的值必须在函数调用前后保持一致（堆栈平衡），否则会导致返回地址错误或栈帧混乱。例如：

若参数入栈后未清理（如cdecl调用者忘记add esp, 8），esp会偏小，下一次栈操作会覆盖错误的内存。
若函数中修改ebp且未恢复，mov esp, ebp会导致esp错误，破坏栈结构。

调用约定（Calling Conventions）

调用约定是一套规则，定义了参数传递方式、堆栈清理责任、寄存器使用等，避免不同编译单元的函数调用混乱。常见的 X86 调用约定如下：

约定	参数入栈顺序	堆栈清理者	适用场景	示例指令
cdecl	右到左	调用者	C 语言默认（支持可变参数）	调用者用add esp, N
stdcall	右到左	被调用者	Windows API（无可变参数）	被调用者用ret N
fastcall	前 2 参数用寄存器（ecx、edx），其余右到左入栈	被调用者	追求效率的场景（如 C++）	ret N（清理栈上参数）

总结一下

X86 函数调用的核心是栈帧管理和堆栈平衡：

调用者负责参数入栈和返回后的堆栈清理（部分约定）。
被调用者负责构建栈帧（用ebp固定结构）、管理局部变量，并在返回前恢复栈帧。
堆栈平衡是前提，任何环节的esp或ebp错误都会导致程序崩溃（如返回地址被覆盖、局部变量读写越界等）。

理解这一过程是逆向分析（如调试、漏洞利用）和底层开发的基础。

汇编语言栏目列表

汇编语言
5 篇

最近更新

C/C++ 函数调用底层原理：从底层汇编语言角度分析X86 堆栈平衡与执行机制

堆栈平衡

寄存器的备份和恢复

内部变量与返回值

X86中函数的调用与返回

函数调用的完整流程

调用前准备（调用者操作）

进入函数（被调用者操作）

函数执行（被调用者操作）

函数返回（被调用者 + 调用者操作）

关键指令与机制解析

call指令的作用

ret指令的作用

堆栈平衡的核心

调用约定（Calling Conventions）

总结一下

推荐阅读

C/C++函数调用规范

函数调用约定

汇编 Call 指令运行原理详解：从跳转机制到堆栈操作

深入理解汇编语言，程序员必须了解的底层逻辑：常用指令说明

汇编语言栏目列表