BSS段、数据段、代码段、堆与栈

    技术2022-05-19  23

    BSS段:BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

     

    数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

     

    代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

     

    堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

     

    栈(stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

     

    【例一】

     

    用cl编译两个小程序如下: 

    程序1:

     

    int ar[30000]; 

    void main() 

        ...... 

    }

     

    程序2:

     

    int ar[300000] =  {1, 2, 3, 4, 5, 6 }; 

    void main() 

        ...... 

    }

     

    发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解,于是手工编译了一下,并使用了/FAs编译选项来查看了一下其各自的.asm,发现在程序1.asm中ar的定义如下:

     

    _BSS SEGMENT 

         ?ar@@3PAHA DD 0493e0H DUP (?)    ; ar 

    _BSS ENDS

     

    而在程序2.asm中,ar被定义为:

     

    _DATA SEGMENT 

         ?ar@@3PAHA DD 01H     ; ar 

                    DD 02H 

                    DD 03H 

                    ORG $+1199988 

    _DATA ENDS

     

    区别很明显,一个位于.bss段,而另一个位于.data段,两者的区别在于:全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。

     

    【例二】

     

    编译如下程序(test.cpp): 

    #include 

    #define LEN 1002000 

    int inbss[LEN]; 

    float fA; 

    int indata[LEN]={1,2,3,4,5,6,7,8,9}; 

    double dbB = 100.0; 

    const int cst = 100; 

    int main(void) 

        int run[100] = {1,2,3,4,5,6,7,8,9}; 

        for(int i=0; i        printf("%d ", inbss[i]); 

        return 0; 

    命令:cl /FA  test.cpp 回车 (/FA:产生汇编代码) 

    产生的汇编代码(test.asm): 

        TITLE    test.cpp 

        .386P 

    include listing.inc 

    if @Version gt 510 

    .model FLAT 

    else 

    _TEXT    SEGMENT PARA USE32 PUBLIC 'CODE' 

    _TEXT    ENDS 

    _DATA    SEGMENT DWORD USE32 PUBLIC 'DATA' 

    _DATA    ENDS 

    CONST    SEGMENT DWORD USE32 PUBLIC 'CONST' 

    CONST    ENDS 

    _BSS    SEGMENT DWORD USE32 PUBLIC 'BSS' 

    _BSS    ENDS 

    _TLS    SEGMENT DWORD USE32 PUBLIC 'TLS' 

    _TLS    ENDS 

    FLAT    GROUP _DATA, CONST, _BSS 

        ASSUME    CS: FLAT, DS: FLAT, SS: FLAT 

    endif 

    PUBLIC    ?inbss@@3PAHA                    ; inbss 

    PUBLIC    ?fA@@3MA                    ; fA 

    PUBLIC    ?indata@@3PAHA                    ; indata 

    PUBLIC    ?dbB@@3NA                    ; dbB 

    _BSS    SEGMENT 

    ?inbss@@3PAHA DD 0f4a10H DUP (?)            ; inbss 

    ?fA@@3MA DD    01H DUP (?)                ; fA 

    _BSS    ENDS 

    _DATA    SEGMENT 

    ?indata@@3PAHA DD 01H                    ; indata 

        DD    02H 

        DD    03H 

        DD    04H 

        DD    05H 

        DD    06H 

        DD    07H 

        DD    08H 

        DD    09H 

        ORG $+4007964 

    ?dbB@@3NA DQ    04059000000000000r        ; 100    ; dbB 

    _DATA    ENDS 

    PUBLIC    _main 

    EXTRN    _printf:NEAR 

    _DATA    SEGMENT 

    $SG537    DB    '%d ', 00H 

    _DATA    ENDS 

    _TEXT    SEGMENT 

    _run$ = -400 

    _i$ = -404 

    _main    PROC NEAR 

    ; File test.cpp 

    ; Line 13 

        push    ebp 

        mov    ebp, esp 

        sub    esp, 404                ; 00000194H 

        push    edi 

    ; Line 14 

        mov    DWORD PTR _run$[ebp], 1 

        mov    DWORD PTR _run$[ebp+4], 2 

        mov    DWORD PTR _run$[ebp+8], 3 

        mov    DWORD PTR _run$[ebp+12], 4 

        mov    DWORD PTR _run$[ebp+16], 5 

        mov    DWORD PTR _run$[ebp+20], 6 

        mov    DWORD PTR _run$[ebp+24], 7 

        mov    DWORD PTR _run$[ebp+28], 8 

        mov    DWORD PTR _run$[ebp+32], 9 

        mov    ecx, 91                    ; 0000005bH 

        xor    eax, eax 

        lea    edi, DWORD PTR _run$[ebp+36] 

        rep stosd 

    ; Line 15 

        mov    DWORD PTR _i$[ebp], 0 

        jmp    SHORT $L534 

    $L535: 

        mov    eax, DWORD PTR _i$[ebp] 

        add    eax, 1 

        mov    DWORD PTR _i$[ebp], eax 

    $L534: 

        cmp    DWORD PTR _i$[ebp], 1002000        ; 000f4a10H 

        jge    SHORT $L536 

    ; Line 16 

        mov    ecx, DWORD PTR _i$[ebp] 

        mov    edx, DWORD PTR ?inbss@@3PAHA[ecx*4] 

        push    edx 

        push    OFFSET FLAT:$SG537 

        call    _printf 

        add    esp, 8 

        jmp    SHORT $L535 

    $L536: 

    ; Line 17 

        xor    eax, eax 

    ; Line 18 

        pop    edi 

        mov    esp, ebp 

        pop    ebp 

        ret    0 

    _main    ENDP 

    _TEXT    ENDS 

    END 

    ---------------------------------------- 

    通过汇编文件可以看到,数组inbss和indata位于不同的段(inbss位于bss段,而indata位于data段) 

    若把test.cpp中的indata数组拿掉,查看生成的exe文件的大小,可以发现,indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组,exe文件大小跟没拿掉时相差无几。 

    说明了: 

    bss段(未手动初始化的数据)并不给该段的数据分配空间,只是记录数据所需空间的大小。 

    data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。

     

    数据段包含经过初始化的全局变量以及它们的值。BSS段的大小从可执行文件中得到 ,然后链接器得到这个大小的内存块,紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和BSS段的整个区段此时通常称为数据区。

     

     

     

    本文来自博客,转载请标明出处:http://blog.csdn.net/idy_10000/archive/2011/03/05/6225586.aspx


    最新回复(0)