深大计系2实验三
一、 实验目标:
- 理解程序函数调用中参数传递机制;
- 掌握缓冲区溢出攻击方法;
- 进一步熟练掌握GDB调试工具和objdump反汇编工具。
二、实验环境:
- 计算机(Intel CPU)
- Linux 64位操作系统
- GDB调试工具
- objdump反汇编工具
三、实验内容
本实验设计为一个黑客利用缓冲区溢出技术进行攻击的游戏。我们仅给黑客(同学)提供一个二进制可执行文件bufbomb和部分函数的C代码,不提供每个关卡的源代码。程序运行中有3个关卡,每个关卡需要用户输入正确的缓冲区内容,否则无法通过管卡!
要求同学查看各关卡的要求,运用\GDB调试工具和objdump反汇编工具**,通过分析汇编代码和相应的栈帧结构,通过缓冲区溢出办法在执行了getbuf()函数返回时作攻击,使之返回到各关卡要求的指定函数中。第一关只需要返回到指定函数,第二关不仅返回到指定函数还需要为该指定函数准备好参数,最后一关要求在返回到指定函数之前执行一段汇编代码完成全局变量的修改。
实验代码bufbomb和相关工具(sendstring/makecookie)的更详细内容请参考“实验四 缓冲区溢出攻击实验.pptx”。
本实验要求解决关卡1、2、3,给出实验思路,通过截图把实验过程和结果写在实验报告上。
四、实验步骤和结果
因为本次实验用到的可执行文件是32位,而实验环境是64位的,需要先安装一个32位的库
1 | objdump -d bufbomb >> 1.txt |
首先利用反汇编命令查看getbuf函数的汇编代码,以便分析getbuf在调用
步骤1 返回到**smoke()**
解题思路
本实验中,bufbomb中的test()函数将会调用getbuf()函数,getbuf()函数再调用gets()从标准输入设备读入字符串。
系统函数gets()未进行缓冲区溢出保护。其代码如下:
1 | int getbuf() |
我们的目标是使getbuf()返回时,不返回到test(),而是直接返回到指定的smoke()函数。
为此,我们可以通过构造并输入大于getbuf()中给出的数据缓冲区的字符串而破坏getbuf()的栈帧,替换其返回地址,将返回地址改成smoke()函数的地址。
解题过程
分析getbuf()函数的汇编代码,可以发现,getbuf()在保存%ebp的旧值后,将%ebp指向%esp所指的位置,然后将栈指针减去0x28来分配额外的20个字节的地址空间。字符数组buf的位置用%ebp下0x18(即24)个字节来计算。然后调用Gets()函数,读取的字符串返回到%ebp-0x18,即%ebp-24。
具体的栈帧结构如下:
栈帧 | |
---|---|
返回地址 | 属于调用者的栈帧 |
保存的%ebp旧值 | %ebp |
20-23 | |
16-19 | |
12-15 | |
[11] [10] [9] [8] | |
[7] [6] [5] [4] | |
[3] [2] [1] [0] | buf,%ebp-0x18 |
%esp,%ebp-0x24 |
从以上分析可得,只要输入不超过11个字符,gets返回的字符串(包括末尾的null)就能够放进buf分配的空间里。长一些的字符串就会导致gets覆盖栈上存储的某些信息。
随着字符串变长,下面的信息会被破坏:
输入的字符数量 | 附加的被破坏的状态 |
---|---|
0-11 | 无 |
12-23 | 分配后未使用的空间 |
24-27 | 保存的%ebp旧值 |
28-31 | 返回地址 |
32+ | 调用者test()中保存的状态 |
因此,我们要替换返回地址,需要构造一个长度至少为32的字符串,其中的第0~11个字符放进buf分配的空间里,第12~23个字符放进程序分配后未使用的空间里,第24~27个字符覆盖保存的%ebp旧值,第28-31个字符覆盖返回地址。
由于替换掉返回地址后,getbuf()函数将不会再返回到test()中,所以覆盖掉test()的%ebp旧值并不会有什么影响。也就是说我们构造的长度为32的字符串前28个字符随便是啥都行,而后面四个字符就必须能表示smoke()函数的地址。所以我们要构造的字符串就是“28个任意字符+smoke()地址”。任意的28个字符都用十六进制数00填充就行。
最终结果截图
通过在0.txt中传入以下数据
00112233445566778899001122334455667788990011223344556677b08e0408
成功通过栈溢出改变了返回地址,调用了smoke( )函数
步骤2 返回到fizz()并准备相应参数
2.1 解题思路
这一关要求返回到fizz()并传入自己的cookie值作为参数,破解的思路和第一关是类似的,构造一个超过缓冲区长度的字符串将返回地址替换成fizz()的地址,只是增加了一个传入参数,所以在读入字符串时,要把fizz()函数读取参数的地址替换成自己的cookie值,具体细节见解题过程。
2.2 解题过程
首先还是利用objdunp查看并分析fizz()函数的汇编代码
从汇编代码可知,fizz()函数被调用时首先保存%ebp旧值并分配新的空间,然后读取%ebp-0x8地址处的内容作为传入的参数,要求传入的参数是自己的cookie值。也就是说传入的参数其实是存在%ebp-0x8处的,具体的栈帧结构如下:
栈帧 | |
---|---|
传入的参数 | %ebp+0x8 |
%ebp+0x4 | |
保存的%ebp旧值 | %ebp |
%esp |
对应到getbuf()函数中的栈帧结构如下:
栈帧 | |
---|---|
需要替换成cookie传入fizz() | |
任意替换 | |
返回地址 | 属于调用者的栈帧 |
保存的%ebp旧值 | %ebp,需要替换成fizz()的地址 |
任意替换 | |
任意替换 | |
任意替换 | |
[11] [10] [9] [8] | |
[7] [6] [5] [4] | |
[3 ] [2] [1] [0] | buf,%ebp-0x18 |
%esp,%ebp-0x24 |
由以上结构不难判断出,我们需要读入buf的字符串为“28个任意字符+fizz()的地址+4个任意的字符+自己的cookie值”,每个字符还是用十六进制数表示。
2.3 最终结果截图
输入
00112233445566778899001122334455667788990011223344556677608e0408001122330032ae6d
步骤3 返回到bang()且修改global_value
解题思路
这一关要求先修改全局变量global_value的值为自己的cookie值,再返回到band()。为此需要先编写一段代码,在代码中把global_value的值改为自己的cookie后返回到band()函数。将这段代码通过GCC产生目标文件后读入到buf数组中,并使getbuf函数的返回到buf数组的地址,这样程序就会执行我们写的代码,修改global_value的值并调用band()函数。具体细节见解题过程。
解题过程
首先,为了能精确地指定跳转地址,先在root权限下关闭Linux的内存地址随机化:
1 | sudo su |
用objdump查看bang()函数的汇编代码如下:
很明显,bang()函数首先读取0x804a1c4和0x804a1d4的地址的内容并进行比较,要求两个地址中的内容相同:
用gdb调试命令查看:
可以发现,0x804a1c4就是全局变量global_value的地址,0x804a1d4是cookie的地址。因此,我们只要在自己写的代码中,把地址0x804a1d4的内容存到地址0x804a1c4就行了。
再利用objdump得到bang()函数的入口地址为0x08048e10:
到这里,就可以确定我们自己写的代码要干的事情了。首先是将global_value的值设置为cookie的值,也就是将0x804a1c4的值设置为0x804a1d4的值,然后将bang()函数的入口地址0x08048e10压入栈中,这样当函数返回的时候,就会直接取栈顶作为返回地址,从而调用bang()函数。接着函数返回,此时返回的地址就是上一条语句中压入栈中的地址,也就是bang()函数的入口地址了。
根据上述思路,可以写出以下代码来调用bang( )函数
以上代码是在编译再反编译呈现出来的,复制代码的十六进制表示,填入0.txt的输入文件中,由于getbuf( )函数里从ebp-0x18位置开始读取字符串,经过计算后,这里的20字节的代码,再加上8字节的占用字符串,然后就可以填入4字节的返回地址,返回地址则填入buf数组的首地址,用来调用buf数组里的,上述自己写的可执行代码,代码执行完后自然会返回到bang( )
0.txt中填入:
8b1425d4a10408891425c4a1040868108e0408c31122334455667788c0b1ffff
最后四个字节是栈帧地址,每个用户都是不同的。
最终结果截图
五、实验总结与体会
通过这次实验我收获了以下几点:
1、进一步掌握objdump反汇编和gdb调试,学会还原栈帧和分析运行时栈的组成。
2、学会了如何通过栈溢出来实现非法的函数调用,学会了如何防止此类栈溢出造成的安全隐患问题。
3、学会分析全局变量和在栈溢出中用十六进制传入自己写的代码。