理解缓冲区溢出：原理、实践与安全

154 浏览量更新于2024-07-15 收藏 185KB PDF 举报

"缓冲区溢出的原理和实践(Phrack)" 缓冲区溢出是一种常见的软件安全漏洞，尤其在C语言编程中尤为突出。当程序在处理动态分配的内存（如堆栈）时，若没有正确地限制输入数据的长度，就可能导致超出缓冲区的边界，覆盖相邻内存区域的数据。这种情况在过去的几个月里，由于诸如syslog、splitvt、sendmail 8.7.5、Linux/FreeBSD mount、Xtlibrary和at等应用中的漏洞，变得日益严重。缓冲区本身是计算机内存中的一段连续区域，用于存储相同类型的数据项，如字符数组。在C语言中，程序员常通过数组来操作缓冲区，尤其是字符数组。数组可以是静态的（在程序加载时分配）或动态的（在程序运行时分配到堆栈或堆）。这里的重点在于动态缓冲区溢出，也就是基于堆栈的溢出。理解缓冲区溢出的关键在于了解进程的内存布局。一个进程的内存分为三个部分：文本、数据和堆栈。文本区域包含执行指令和只读数据，而数据区域则存储已初始化和未初始化的静态变量。堆栈则用于存储函数调用时的局部变量和返回地址等临时信息。堆栈遵循“后进先出”（LIFO）原则，新分配的内存位于栈顶，最先分配的内存位于栈底。随着函数调用的进行，栈会不断增长；当函数返回时，栈空间被释放，恢复到调用前的状态。当一个函数接收超过其分配缓冲区大小的输入时，超出的字节会溢出到堆栈上的其他区域。如果这些溢出的数据能够覆盖函数返回地址，攻击者就可以控制程序的执行流程，执行任意代码，从而实现远程代码执行或权限提升等恶意行为。防范缓冲区溢出通常需要采取以下措施： 1. 使用安全编程技术，如限制输入长度，使用安全的字符串函数（如strncpy代替strcpy）。 2. 编译器级别的防护，如开启Stack Canaries，它在函数返回地址前插入一个检查值，防止被溢出数据覆盖。 3. 使用内存安全的语言或框架，如Rust或Java，它们在设计上就避免了指针和内存管理带来的许多安全问题。理解缓冲区溢出原理并掌握其防范方法是保障软件安全的重要一环。熟悉汇编语言、虚拟内存概念以及调试工具如gdb的使用，对于识别和修复此类漏洞至关重要。对于Intel x86架构的Linux系统，开发者需要特别关注堆栈布局和相关的安全实践，以减少潜在的安全风险。

[aleph1]$ gdb example3

GDB is free software and you are welcome to distribute copies of it

under certain conditions; type "show copying" to see the conditions.

There is absolutely no warranty for GDB; type "show warranty" for details.

(no debugging symbols found)...

(gdb) disassemble main

Dump of assembler code for function main:

0x8000490 <main>: pushl %ebp

0x8000491 <main+1>: movl %esp,%ebp

0x8000493 <main+3>: subl $0x4,%esp

0x8000496 <main+6>: movl $0x0,0xfffffffc(%ebp)

0x800049d <main+13>: pushl $0x3

0x800049f <main+15>: pushl $0x2

0x80004a1 <main+17>: pushl $0x1

0x80004a3 <main+19>: call 0x8000470 <function>

0x80004a8 <main+24>: addl $0xc,%esp

0x80004ab <main+27>: movl $0x1,0xfffffffc(%ebp)

0x80004b2 <main+34>: movl 0xfffffffc(%ebp),%eax

0x80004b5 <main+37>: pushl %eax

0x80004b6 <main+38>: pushl $0x80004f8

0x80004bb <main+43>: call 0x8000378 <printf>

0x80004c0 <main+48>: addl $0x8,%esp

0x80004c3 <main+51>: movl %ebp,%esp

0x80004c5 <main+53>: popl %ebp

0x80004c6 <main+54>: ret

0x80004c7 <main+55>: nop

------------------------------------------------------------------------------

我们看到当调用function()时, RET会是0x8004a8, 我们希望跳过在0x80004ab的赋值指令. 下一个想要执行的指令在0x8004b2.

简单的计算告诉我们两个指令的距离为8字节.

Shell Code

现在我们可以修改返回地址即可以改变程序执行的流程, 我们想要执行什么程序呢?在大多数情况下我们只是希望程序派生出

一个shell. 从这个shell中, 可以执行任何我们所希望的命令. 但是如果我们试图破解的程序里并没有这样的代码可怎么办呢? 我

们怎么样才能将任意指令放到程序的地址空间中去呢? 答案就是把想要执行的代码放到我们想使其溢出的缓冲区里, 并且覆盖

函数的返回地址, 使其指向这个缓冲区. 假定堆栈的起始地址为0xFF, S代表我们想要执行的代码, 堆栈看起来应该是这样:

内存低 DDDDDDDDEEEEEEEEEEEE EEEE FFFF FFFF FFFF FFFF 内存高

地址 89ABCDEF0123456789AB CDEF 0123 4567 89AB CDEF 地址

buffer sfp ret a b c

<------ [SSSSSSSSSSSSSSSSSSSS][SSSS][0xD8][0x01][0x02][0x03]

^ |

|____________________________|

堆栈顶部堆栈底部

派生出一个shell的C语言代码是这样的:

shellcode.c

-----------------------------------------------------------------------------

#include <stdio.h>

void main() {

char *name[2];

name[0] = "/bin/sh";

name[1] = NULL;

execve(name[0], name, NULL);

}

------------------------------------------------------------------------------

为了查明这程序变成汇编后是个什么样子, 我们编译它, 然后祭出调试工具gdb. 记住在编译的时候要使用-static标志, 否则系统

调用execve的真实代码就不会包括在汇编中,取而代之的是对动态C语言库的一个引用, 真正的代码要到程序加载的时候才会联

入.

------------------------------------------------------------------------------

[aleph1]$ gcc -o shellcode -ggdb -static shellcode.c

剩余19页未读，继续阅读

weixin_38686080

粉丝: 2
资源: 963

理解缓冲区溢出：原理、实践与安全

缓冲取溢出攻击原理案例

《网络安全技术》大作业:缓冲区溢出实验报告

好资料------------缓冲区溢出资料

缓冲区溢出原理与实战：攻击与防御指南

缓冲区溢出攻击原理+实例讲解

phrack 1-66合辑

溢出攻击与防范.pdf

堆溢出攻击教程（heap overflow attack）

理解缓冲区溢出：原理、危害与防范

深入理解：缓冲区溢出漏洞分析与利用

最新资源