[语言编程类] 大神论坛逆向脱壳分析基础学习笔记二十三汇编指针（...

kay2kay · 发表于 2021-03-14 23:58

本帖最后由 kay2kay 于 2021-03-14 23:58 编辑

本文为本人的滴水逆向破解脱壳学习笔记之一，为本人对以往所学的回顾和总结，可能会有谬误之处，欢迎大家指出。
陆续将不断有笔记放出,希望能对想要入门的萌新有所帮助，一起进步

所有笔记链接：

指针四

指针数组

什么是指针数组

首先回顾一下先前关于数组的知识：

所谓数组就是用于存储相同数据类型的集合

再结合先前关于指针的知识：指针的本质也是一种数据类型

于是当数组中存储的成员的数据类型为指针时，该数组就可以称为指针数组（本质是数组）

代码

#include "stdafx.h"
void function(){
        int** arr[5]={(int**)1,(int**)2,(int**)3,(int**)4,(int**)5};
}
int main(int argc, char* argv[])
{
        function();
        return 0;
}

反汇编代码

9:        int** arr[5]={(int**)1,(int**)2,(int**)3,(int**)4,(int**)5};
00401038   mov         dword ptr [ebp-14h],1
0040103F   mov         dword ptr [ebp-10h],2
00401046   mov         dword ptr [ebp-0Ch],3
0040104D   mov         dword ptr [ebp-8],4
00401054   mov         dword ptr [ebp-4],5

小总结

可以看到指针数组其实并没有什么特别之处，只不过存储的数组成员的数据类型为指针而已
指针数组的赋值也和先前对指针的赋值没有什么区别

结构体指针

什么是结构体指针

所谓结构体指针就是在结构体后加上若干个*使其称为一个指针类型

代码

#include "stdafx.h"
#include <typeinfo>

struct S1{
        int a;
};

void function(){
        S1* s1=(S1*)0x12345678;
    printf("%x\n",s1);
}
int main(int argc, char* argv[])
{
        function();
        return 0;
}

运行结果

结果分析

可以看到，这里关于结构体指针的使用貌似和普通的指针没有什么区别，但此时会发现这里还没有操作结构体内部的成员

所以结构体指针的实际使用也并不是这样，下面看一个错误的例子

错误代码

void function(){
        S1* s1=(S1*)0x12345678;
    int a=s1->a;
}

只是在上面代码的基础上添加了一个读取结构体成员的语句，查看运行结果

运行结果

运行结果不出所料出错了，开始分析错误的原因

反汇编代码

14:       S1* s1=(S1*)0x12345678;
00401038   mov         dword ptr [ebp-4],12345678h
15:       int a=s1->a;
0040103F   mov         eax,dword ptr [ebp-4]
00401042   mov         ecx,dword ptr [eax]
00401044   mov         dword ptr [ebp-8],ecx

反汇编分析

0.执行前s1和s1->a的状态

s1：

s1->a：

1.为结构体指针s1赋值

14:       S1* s1=(S1*)0x12345678;
00401038   mov         dword ptr [ebp-4],12345678h

此时再看看s1->a：

可以发现对s1的赋值操作，改变的不是s1->a的值，而是改变了s1->a的地址

其实从执行前s1和s1->a的状态就可以看出，s1存储的内容并不是直接存储结构体成员的内容，而是存储指向结构体成员的地址

所以这里对于先前对于s1的赋值操作改变的只是成员的地址，而没有改变成员的值

并且刚开始时，结构体成员并没有被分配对应的内存地址

2.访问s1->a

15:       int a=s1->a;
0040103F   mov         eax,dword ptr [ebp-4]
00401042   mov         ecx,dword ptr [eax]
00401044   mov         dword ptr [ebp-8],ecx

此时出错的原因已经显而易见了，先前对s1的赋值操作修改了s1->a的地址，使其指向了一个不可访问的地址而导致出错

正确代码

前面已经知道了出错的原因是访问了不可访问的地址导致出错，并且刚开始结构体成员没有被分配对应的内存地址

于是只要手动为结构体成员分配内存地址即可，这里将使用到malloc函数来进行分配内存地址

malloc函数

void *malloc(size_t size)

参数：size，内存块的大小，以字节为单位

返回值：返回一个指针，指向已分配大小的内存。如果请求失败，则返回 NULL

相关头文件：malloc.h、alloc.h、stdlib.h

大致了解了malloc函数，现在来看代码：

#include "stdafx.h"
#include <malloc.h>                //这里使用了malloc.h
struct S1{
    int a;
        int b;
        int c;
};
void function(){
        S1* s1=(S1*) malloc(sizeof(S1));        //申请一块空间大小正好为S1大小的内存
        s1->a=610;
        s1->b=666;
        s1->c=52;
        printf("%d\n",s1->a);
        printf("%d\n",s1->b);
        printf("%d\n",s1->c);
}
int main(int argc, char* argv[])
{
        function();
        return 0;
}

运行结果

可以看到结构体的成员能够正常地被改写和访问

反汇编代码

15:       S1* s1=(S1*) malloc(sizeof(S1));
0040D778   push        0Ch
0040D77A   call        malloc (00401150)
0040D77F   add         esp,4
0040D782   mov         dword ptr [ebp-4],eax
16:       s1->a=610;
0040D785   mov         eax,dword ptr [ebp-4]
0040D788   mov         dword ptr [eax],262h
17:       s1->b=666;
0040D78E   mov         ecx,dword ptr [ebp-4]
0040D791   mov         dword ptr [ecx+4],29Ah
18:       s1->c=52;
0040D798   mov         edx,dword ptr [ebp-4]
0040D79B   mov         dword ptr [edx+8],34h

反汇编分析

1.先看这个malloc函数

15:       S1* s1=(S1*) malloc(sizeof(S1));
0040D778   push        0Ch
0040D77A   call        malloc (00401150)
0040D77F   add         esp,4
0040D782   mov         dword ptr [ebp-4],eax

压入了参数0C，对应十进制为12，也就是S1的大小
调用malloc函数
堆栈外平衡
将返回值eax赋值给S1

看看返回值eax的内容：

可以看到eax就对应了结构体中的成员

eax=结构体成员首地址，里面的结构体成员连续存储

2.赋值，将610对应十六进制262赋值给[eax]，对应前面的003807B8

16:       s1->a=610;
0040D785   mov         eax,dword ptr [ebp-4]
0040D788   mov         dword ptr [eax],262h

执行后：

3.赋值，将666对应十六进制29A赋值给[ecx+4]，对应前面的003807BC

17:       s1->b=666;
0040D78E   mov         ecx,dword ptr [ebp-4]
0040D791   mov         dword ptr [ecx+4],29Ah

执行后：

4.赋值，将52对应十六进制34赋值给[edx+4]，对应前面的003807C0

18:       s1->c=52;
0040D798   mov         edx,dword ptr [ebp-4]
0040D79B   mov         dword ptr [edx+8],34h

执行后：

小总结

结构体指针和普通的指针实际上并没有什么不同
在对结构体成员进行操作时，需要先对其进行初始化（为每个结构体成员分配内存地址）
结构体指针并不直接存储结构体成员，而是存储了指向结构体成员的地址，该地址里存放着所有结构体成员

数组指针

前面学了指针数组，现在又来个数组指针，中间用结构体指针作了过渡，避免混淆

什么是数组指针

所谓数组指针，就是指向数组的指针（本质是指针）

既然是指针自然满足先前指针的一切特征：指针的赋值、指针的数据宽度、指针的加减、指针类型相减、指针之间比较

这里就不再赘述先前的内容，有需要可回顾：逆向基础笔记二十汇编指针（一）

数组指针的声明

int (*px)[2];

声明如上，数组指针变量为px，类型为：int(*)[2]；该数组指针指向的数组为int[2]

数组指针和指向数组的指针区别

代码

#include "stdafx.h"

void function(){
        int arr[6]={1,2,3,4,5,6};
        //声明一个数组指针，该指针指向数组为：int[2]
        int (*px)[2];        
        //给数组指针赋值，使该数组指针指向arr数组的首地址
        px=(int (*)[2]) &arr[0];
        //用一个临时变量parr2 存储数组指针
        int (*parr2)[2]=px;
    //*px为数组的首地址，也就是arr,这里就相当于int* arr2=arr;此时的arr2就是指向数组的指针
        int* arr2=*px;
    //初始化变量，准备循环
    int i;
    //循环遍历数组
        for(i=0;i<6;i++){
                printf("%x\t%d\n",arr2+i,arr2[i]);
        }
        printf("\n");        
        int a=(int) (parr2+1);
        int b=(int) (arr2+1);
        printf("%x\t%x\n",a,b);   
}
int main(int argc, char* argv[])
{
        function();
        return 0;
}

运行结果

首先可以看到数组的正常遍历

然后分别输出了parr2+1和arr2+1的结果，注意这里的结果不同

反汇编代码

8:        int arr[6]={1,2,3,4,5,6};
00401038   mov         dword ptr [ebp-18h],1
0040103F   mov         dword ptr [ebp-14h],2
00401046   mov         dword ptr [ebp-10h],3
0040104D   mov         dword ptr [ebp-0Ch],4
00401054   mov         dword ptr [ebp-8],5
0040105B   mov         dword ptr [ebp-4],6
9:
10:       int (*px)[2];
11:
12:       px=(int (*)[2]) &arr[0];
00401062   lea         eax,[ebp-18h]
00401065   mov         dword ptr [ebp-1Ch],eax
13:
14:       int (*parr2)[2]=px;
00401068   mov         ecx,dword ptr [ebp-1Ch]
0040106B   mov         dword ptr [ebp-20h],ecx
15:       int* arr2=*px;
0040106E   mov         edx,dword ptr [ebp-1Ch]
00401071   mov         dword ptr [ebp-24h],edx
16:
17:       int i;
18:
19:       for(i=0;i<6;i++){
00401074   mov         dword ptr [ebp-28h],0
0040107B   jmp         function+66h (00401086)
0040107D   mov         eax,dword ptr [ebp-28h]
00401080   add         eax,1
00401083   mov         dword ptr [ebp-28h],eax
00401086   cmp         dword ptr [ebp-28h],6
0040108A   jge         function+8Fh (004010af)
20:           printf("%x\t%d\n",arr2+i,arr2[i]);
0040108C   mov         ecx,dword ptr [ebp-28h]
0040108F   mov         edx,dword ptr [ebp-24h]
00401092   mov         eax,dword ptr [edx+ecx*4]
00401095   push        eax
00401096   mov         ecx,dword ptr [ebp-28h]
00401099   mov         edx,dword ptr [ebp-24h]
0040109C   lea         eax,[edx+ecx*4]
0040109F   push        eax
004010A0   push        offset string "%x\t%d\n" (00422024)
004010A5   call        printf (00401160)
004010AA   add         esp,0Ch
21:       }
004010AD   jmp         function+5Dh (0040107d)
22:       printf("\n");
004010AF   push        offset string "\n" (00422020)
004010B4   call        printf (00401160)
004010B9   add         esp,4
23:
24:       int a=(int) (parr2+1);
004010BC   mov         ecx,dword ptr [ebp-20h]
004010BF   add         ecx,8
004010C2   mov         dword ptr [ebp-2Ch],ecx
25:       int b=(int) (arr2+1);
004010C5   mov         edx,dword ptr [ebp-24h]
004010C8   add         edx,4
004010CB   mov         dword ptr [ebp-30h],edx
26:       printf("%x\t%x\n",a,b);
004010CE   mov         eax,dword ptr [ebp-30h]
004010D1   push        eax
004010D2   mov         ecx,dword ptr [ebp-2Ch]
004010D5   push        ecx
004010D6   push        offset string "%x\t%x\n" (00422fa4)
004010DB   call        printf (00401160)
004010E0   add         esp,0Ch

反汇编分析

1.数组的初始化

8:        int arr[6]={1,2,3,4,5,6};
00401038   mov         dword ptr [ebp-18h],1
0040103F   mov         dword ptr [ebp-14h],2
00401046   mov         dword ptr [ebp-10h],3
0040104D   mov         dword ptr [ebp-0Ch],4
00401054   mov         dword ptr [ebp-8],5
0040105B   mov         dword ptr [ebp-4],6

数组初始化后对应地址和内容为：

2.数组指针的赋值

12:       px=(int (*)[2]) &arr[0];
00401062   lea         eax,[ebp-18h]
00401065   mov         dword ptr [ebp-1Ch],eax

直接将arr数组的首地址也就是0012FF14传给了eax

然后再将eax赋值给数值指针px

数值指针赋值后：

可以看到数值指针里存储的内容为0012FF14即arr的地址

3.将数值指针px赋值给另一个数组指针parr2

14:       int (*parr2)[2]=px;
00401068   mov         ecx,dword ptr [ebp-1Ch]
0040106B   mov         dword ptr [ebp-20h],ecx

赋值后：

可以看到此时parr2里存储的内容=px里存储的内容=0012FF14=arr首地址

4.将数组的首地址赋值给arr2，即arr2=arr

14:       int* arr2=*px;
0040D82E   mov         edx,dword ptr [ebp-1Ch]
0040D831   mov         dword ptr [ebp-24h],edx

这里要注意到这里和前面一样都是赋值了[ebp-1Ch]

也就是明明赋值的是*px，但是赋值却和px一样

也可以得出结论*px=px，那么*为什么px和px是一样的**？

首先要明确无论是px还是*px 它们都是指针，一个为数组指针，而另一个则为普通指针

它们所指向的地址相同，都指向了arr的首地址0012FF14

区别px和*px的本质就在于其数据类型是两种不同的指针结构

指针在相加减时，加减的基本单位是指针去掉一个*后的数据宽度（有疑惑可移步逆向基础笔记二十汇编指针（一））

px的数据类型为：int (*)[2]，去掉一个*后变为int [2]，数据宽度为int的数据宽度×数组的成员数=4*2=8
*px的数据类型为：int*，去掉一个*后变为int，数据宽度=4

赋值后：

5.循环遍历数组

就是普通的指针循环数组，在先前的笔记中已经有详细介绍，这里不再赘述

6.第二种循环

24:       int a=(int) (parr2+1);
004010BC   mov         ecx,dword ptr [ebp-20h]
004010BF   add         ecx,8
004010C2   mov         dword ptr [ebp-2Ch],ecx
25:       int b=(int) (arr2+1);
004010C5   mov         edx,dword ptr [ebp-24h]
004010C8   add         edx,4
004010CB   mov         dword ptr [ebp-30h],edx

通过前面可以得知*px=px，parr2=arr2，所以这里的[ebp-20h]=[ebp-24h]的：

这里的不同之处就在于一个add了8，另一个add了4，和先前所分析的指针加减的单位相符合，于是产生了不同的结果

小总结

在一个数组指针前加上*获得的就是指向数组的指针，如上例中的int arr2=px;
数值指针和指向数组的指针中存储的内容都是数组的首地址，如上例中的px=*px=arr=0012FF14
数组指针和指向数组的指针的主要区别在进行运算时的单位不同，前者为数据类型宽度×数组成员数，后者为数据类型宽度

数组指针的应用

可以利用数组指针进行加减时的单位不同来遍历数组的固定间隔的成员

下例为从数组的第二个成员开始，取出间隔为3的数组成员

代码

#include "stdafx.h"
void function(){
        int arr[15]={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15};

        int (*px)[3];        
        //从数组的第二个成员开始
        px=(int (*)[3]) &arr[1];

        int i=0;
        for(i=0;i<15/3;i++){
                printf("%x\t%d\n",px+i,**(px+i));
        //注意这里取了两次*，第一次获得的是指向数组成员的指针，第二个获得的才是数组成员
        }
}
int main(int argc, char* argv[])
{
        function();
        return 0;
}

运行结果

总结

	指针数组	结构体指针	数组指针
本质	数组	指针	指针
描述	数组成员类型为指针的数组	指向结构体的指针	指向数组的指针
声明	type* arr[size]	struct *structName	int (*name)[size]
补充	指针数组的赋值也和先前对指针的赋值没有什么区别	在对结构体成员进行操作时，需要先对其进行初始化；结构体指针并不直接存储结构体成员，而是存储了指向结构体成员的地址，该地址里存放着所有结构体成员	数组指针和指向数组的指针的主要区别在进行运算时的单位不同，前者为数据类型宽度×数组成员数，后者为数据类型宽度

		自动登录	找回密码
密码			快速注册


	扫码赞助关闭微信赞助支付宝赞助微信扫一扫有你们的支持大神论坛会做得更好! 支付宝扫一扫有你们的支持大神论坛会做得更好!


	举报关闭请点击举报理由广告垃圾违规内容恶意灌水重复发帖其他请填写举报内容还可输入 200 个字符

扫码赞助 关闭

用户登录 关闭

找回密码 关闭

用户登录 关闭

[语言编程类] 大神论坛 逆向脱壳分析基础学习笔记二十三 汇编 指针（...

更多逆向脱壳资源，请访问 大神论坛

指针四

指针数组

什么是指针数组

代码

反汇编代码

小总结

结构体指针

什么是结构体指针

代码

运行结果

结果分析

错误代码

运行结果

反汇编代码

反汇编分析

正确代码

malloc函数

运行结果

反汇编代码

反汇编分析

小总结

数组指针

什么是数组指针

数组指针的声明

数组指针和指向数组的指针区别

代码

运行结果

反汇编代码

反汇编分析

小总结

数组指针的应用

代码

运行结果

总结

举报 关闭

评分 关闭

可选评分理由:

扫码赞助关闭

用户登录关闭

找回密码关闭

用户登录关闭

[语言编程类] 大神论坛逆向脱壳分析基础学习笔记二十三汇编指针（...

更多逆向脱壳资源，请访问大神论坛

举报关闭

评分关闭