c++中堆、栈内存分配

首先来看看主要有几种程序内存分配：

一个由C/C++编译程序占用内存分为以下几个部分
1、栈区（stack）— 由编译器自动分配释放，存放函数参数值，局部变量值等。其操作方式类似于数据结构中栈。
2、堆区（heap） — 一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中堆是两回事，分配方式倒是类似于链表，呵呵。
3、全局区（静态区）（static）—，全局变量和静态变量存储是放在一块，初始化全局变量和静态变量在一块区域，未初始化全局变量和未初始化静态变量在相邻另一块区域。 - 程序结束后由系统释放。-->分别是data区，bbs区
4、文字常量区 —常量字符串就是放在这里。程序结束后由系统释放-->coment区
5、程序代码区—存放函数体二进制代码。-->code(text)区

经典实例：

#include <string>
int a=0;    //全局初始化区
char *p1;   //全局未初始化区
void main()
{
    int b;//栈
    char s[]="abc";   //栈
    char *p2;         //栈
    char *p3="123456";   //123456在常量区，p3在栈上。
    static int c=0;   //全局（静态）初始化区
    p1 = (char*)malloc(10);
    p2 = (char*)malloc(20);   //分配得来的10和20字节的区域就在堆区。
    strcpy(p1,"123456");   //123456放在常量区，编译器可能会将它与p3所向"123456"优化成一个地方。
}

一、堆和栈究竟有什么区别(堆和栈理论知识)？

2.1申请方式
stack:
　　由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间
heap:
　　需要程序员自己申请，并指明大小，在c中malloc函数
　　　　如p1 = (char *)malloc(10);
　　　　如p2 = (char *)malloc(10);

　　在C++中用new运算符：

　　　　int *p = new int(10); 　　// new一个整型数

　　但是注意p、p1、p2本身是在栈中。

2.2申请后系统响应
栈：只要栈剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。
堆：首先应该知道操作系统有一个记录空闲内存地址链表，当系统收到程序申请时，会遍历该链表，寻找第一个空间大于所申请空间堆结点，然后将该结点从空闲结点链表中删除，并将该结点空间分配给程序，另外，对于大多数系统，会在这块内存空间中首地址处记录本次分配大小，这样，代码中delete语句才能正确释放本内存空间。另外，由于找到堆结点大小不一定正好等于申请大小，系统会自动将多余那部分重新放入空闲链表中。

2.3申请大小限制

栈：在Windows下,栈是向低地址扩展数据结构(栈向下生长)，是一块连续内存区域。这句话意思是栈顶地址和栈最大容量是系统预先规定好，在WINDOWS下，栈大小是2M（也有说是1M，总之是一个编译时就确定常数），如果申请空间超过栈剩余空间时，将提示overflow。因此，能从栈获得空间较小。

堆：堆是向高地址扩展数据结构（堆向上生长），是不连续内存区域。这是由于系统是用链表来存储空闲内存地址，自然是不连续，而链表遍历方向是由低地址向高地址。堆大小受限于计算机系统中有效虚拟内存。由此可见，堆获得空间比较灵活，也比较大。

2.4申请效率比较：
栈效率高：栈由系统自动分配，速度较快。但程序员是无法控制。
堆效率相对比较低：堆是由new分配内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.

另外，在WINDOWS下，最好方式是用VirtualAlloc分配内存，他不是在堆，也不是在栈是直接在进程地址空间中保留一快内存，虽然用起来最不方便。但是速度快，也最灵活。

2.5堆和栈中存储内容
栈：在函数调用时，第一个进栈是主函数中后下一条指令（函数调用语句下一条可执行语句）地址，然后是函数各个参数，在大多数C编译器中，参数是由右往左入栈，然后是函数中局部变量。注意静态变量是不入栈。
当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存地址，也就是主函数中下一条指令，程序由该点继续运行。

堆：一般是在堆头部用一个字节存放堆大小。堆中具体内容有程序员安排。

2.6存取效率比较

char s1[] = "aaaaaaaaaaaaaaa";
char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在运行时刻赋值；

而bbbbbbbbbbb是在编译时就确定；
但是，在以后存取中，在栈上数组比指针所指向字符串(例如堆)快。
比如：

＃include
void main()
{
char a = 1;
char c[] = "1234567890";
char *p ="1234567890";
a = c[1];
a = p[1];
return;
}

对应汇编代码

10: a = c[1];
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]
0040106A 88 4D FC mov byte ptr [ebp-4],cl
11: a = p[1];
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]
00401070 8A 42 01 mov al,byte ptr [edx+1]
00401073 88 45 FC mov byte ptr [ebp-4],al

第一种在读取时直接就把字符串中元素读到寄存器cl中，而第二种则要先把指针值读到edx中，在根据edx读取字符，显然慢了。

2.7小结：
堆和栈区别可以用如下比喻来看出：
使用栈就象我们去饭馆里吃饭，只管点菜（发出申请）、付钱、和吃（使用），吃饱了就走，不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作，他好处是快捷，但自由度小。
使用堆就象是自己动手做喜欢吃菜肴，比较麻烦，但是比较符合自己口味，而且自由度大。

全局变量或者静态变量，它们都放在堆里
局部变量放在栈里
堆区,也叫自由存储区.
为什么说在堆上分配内存比在栈上分配内存慢？

　　1.堆空间开辟需要用系统函数，栈上直接修改指针.
　　2. 堆空间管理需要系统记帐，栈上空间可以由编译器管理或是保存在某个处理器寄存器中。
　　3. 堆空间释放需要系统管理，栈上释放可以直接丢弃。堆空间需要通过栈上指针间接引用，所以访问会慢；

记得在apue2上面看到关于线程中有这样一段话,大致意思是,一个线程有自己堆栈,可以在堆栈上分配内存,比如说一个结构体,如果这个线程调用了pthread_exit()返回这个结构体指针时候之后要特别小心,因为很有可能这个结构体里面成员值发生改变,这个可以理解,因为同一个进程所有线程资源是共享,当这个线程退出之后那部分以前用过堆栈很可能被其它线程占用,但同时又说如果malloc就不会出现这样问题,
比如，在栈上分一个int，只要esp-4就可以了，
在堆上系统要记录被分配内存信息，以便释放
BTW:
栈有序
堆无序
－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－
内存分配方式有三种：

   1.从静态存储区域分配。内存在程序编译时候就已经分配好，这块内存在程序整个运行期间都存在。例如全局变量，static变量。

   2.在栈上创建。在执行函数时，函数内局部变量存储单元都可以在栈上创建，函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器指令集中，效率很高，但是分配内存容量有限。

   3.从堆上分配，亦称动态内存分配。程序在运行时候用malloc或new申请任意多少内存，程序员自己负责在何时用free或delete释放内存。动态内存生存期由我们决定，使用非常灵活，但问题也最多。
－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－
一般所说堆栈（stack)往往是指栈，先进后出，它是一块内存区。用以存放程序局部变量，临时变量，函数参数，返回地址等。在这块区域中变量分配和释放由系统自动进行。不需要用户参与。

而在堆(heap,先进先出)上空间则是由用户进行分配，并由用户负责释放。

二、函数调用与堆栈

1)编译器一般使用栈来存放函数的参数，局部变量等来实现函数调用。有时候函数有嵌套调用，这个时候栈中会有多个函数的信息，每个函数占用一个连续的区域。一个函数占用的区域被称作帧（）。同时栈是线程独立的，每个线程都有自己的栈。例如下面简单的函数调用：

堆栈与函数调用（高手） - 毛狼 - maolang0 的博客

另外函数堆栈的清理方式决定了当函数调用结束时由调用函数或被调用函数来清理函数帧，在VC中对函数栈的清理方式由两种：

	参数传递顺序	谁负责清理参数占用的堆栈
__stdcall	从右到左	被调函数
__cdecl	从右到左	调用者

2) 有了上面的知识为铺垫，我们下面细看一个函数的调用时堆栈的变化：

代码如下：

int Add(int x, int y)
{
    return x + y;
}
void main()
{
    int *pi = new int(10);
    int *pj = new int(20);
    int result = 0;
    result = Add(*pi,*pj);
    delete pi;
    delete pj;
}

对上面的代码，我们分为四步，当然我们只画出了我们的代码对堆栈的影响，其他的我们假设它们不存在，哈哈!

第一，int *pi = new int(10); int *pj = new int(20); int result = 0; 堆栈变化如下：

堆栈与函数调用（高手） - 毛狼 - maolang0 的博客

第二，Add(*pi,*pj);堆栈如下(函数参数入栈：从右向左)：

堆栈与函数调用（高手） - 毛狼 - maolang0 的博客

第三，将Add的结果给result，堆栈如下：

堆栈与函数调用（高手） - 毛狼 - maolang0 的博客

第四，delete pi; delete pj; 堆栈如下：

堆栈与函数调用（高手） - 毛狼 - maolang0 的博客

第五，当main()退出后，堆栈如下，等同于main执行前，哈哈！

堆栈与函数调用（高手） - 毛狼 - maolang0 的博客

例子1 ----------------------------------------------------------------------------

【参见】http://blog.csdn.net/wudaijun/article/details/8135205
#include<iostream>
using namespace std;
int main()
{
    char p[] ="123456";
    // char s[10];     //  正常复制: 123456  -- 123456
    char s[4];     //  栈溢出(目标栈空间不够大), output: 56  -- 123456
    char *ptr = p + 3;
    strcpy(s, p);
    cout<< p << "  --  " << s << "  ---  " << ptr << endl;
    return 0;
}

// 栈 内存分配方式 (地址:高(左)->低(右); 数据写入方向:低(右)->高(左))
// '/0' '6' '5' '4'(ptr) '3' '2' '1'(p) '' '' '' ''(s)     // char p[] ="123456";//char s[4];
// '/0' '6' '5' '4'(ptr) '/0' '6' '5'(p) '4' '3' '2' '1'(s)            //strcpy(s, p);
// output : 56  --  123456  ---  456
// 解析：在这里我们可以知道p=s+4;  然后我们对s进行写入"123456"  s所在的四个字节不够用  所以"56"(包括后面的/0)均被写入了p地址 因此输出p将输出56

结果讨论：

关于栈：三个特性:

1. 函数栈内存以一个地址即四个字节对齐。

2. 地址从高地址到低地址分配。

3. 数据从低位地址到高位地址写入。

例子2 ----------------------------------------------------------------------------

#include<iostream>
using namespace std;

int main()
{
     char p[] ="123456";
     int c=0;
     char s[4];
     strcpy(s, p);
     cout<<p<<endl;
     cout<<c<<endl;
     return 0;
}

// output :

　　123456
　　13877
　　请按任意键继续. . .

内存跟踪:

strcpy前:

strcpy后:

结果讨论:

这里和前面不同的地方是在p和s之间插入了一个c 它们的地址大小顺序为: s<c<p 因此对s的写入将覆盖c而不会影响到p

那么c的值是怎么得到的跟踪地址可以知道 c原本表示为: 00 00 00 00 在对s写入"123456"后可以得到c值表为:35 36 00 00

由于操作系统的小端表示，在c的四个字节里高地址(右边)存放数值的高位低地址(左边)存放地址的低位所以c实际的数值摆放为

00 00 36 35 转换成十进制得到13877

例子3 ----------------------------------------------------------------------------

堆的分配规则和栈不一样堆的地址是从小到大分配的并且连续分配的两个内存块的起始地址是肯定不同的。

写在前面: 关于内存所谓的空闲区值：

经常写代码忘了初始化的人可能会注意到，每次定义一个整形变量没有初始化直接使用往往每次都得到一个很大的负数不是说没有分配的内存都是随机的么？看这个示例：

    int main()
     {
          int a;
          int* pb = new int;

          cout<<"a is from stack, b is from heap"<<endl;
          cout<<"(int)a= "<<a<<endl;
          cout<<"(int)b= "<<*pb<<endl;
    
          cout<<"(hex)a= "<<hex<<a<<endl;
          cout<<"(hex)b= "<<hex<<*pb<<endl;
          char* pa = (char*)&a;
          cout<<"(char)a= "<<pa<<endl;
          cout<<"(char)b= "<<(char*)pb<<endl;
    
          delete pb;
          return 0;
     }

vc++6.0输出结果:

我相信这里面出现的这两个字大家都很熟悉了，就连上面的两个负整数应该都是异常眼熟吧接下来揭开谜底：

对于栈和堆的空闲区(未被覆盖前) 是会被默认初始化的，栈内存初始化为CC，堆初始化为CD。初看起来了解这个意义不大但这是下面所说的一些东西的基础。

示例2：

     int main()
     {
          int*a = new int;
          int*b = new int;
          int*c = new int;

          delete a;
          delete b;
          delete c;
     
          return 0;
     }

调试得到

     a = 00382a48
     b = 00382a90
     c = 00382ad8

内存跟踪:

这里面包含了很多信息

1.b指针指向的地址处(00382a90) 被默认初始化为CD(堆未被覆盖前)

2.空闲区两头是有四个字节的界定符的这里是FD FD FD FD

3.继续往上看 00382a70处有一个地址00382a28

4.下一个地址 00382a74处有一个地址00383ab8

在这里我们不妨假设这两个地址就是已经被分配的内存的下一块和上一块

接下来我们对00382a28进行跟踪:

在该地址下面不远处我们找到了00382a48 也就是指针a指向的地址那么到了这里我们可以看出：

堆中每一个内存块是被连接到一个链表上的并且每一个空闲区都被封在一个结构体中

这个结构体至少应该包含：

1. 该数据块的前驱和后继

2. 该数据块大小

3. 数据块的界定符

4. 数据块本身

在这里我们可以看出放在数据块前面的数据区大小=00382a48-00382a28=32个字节

　　（

　　　　00382a48 - 00382a28 = 32Byte

　　　　48(H) = 0100 1000(B) = 72(D)
　　　　28(H) = 0010 1000(B) = 40(D)
　　　　72 - 40 = 32

　　）

同时对其中另一部分数据进行分析初步可以猜测:

00382a38 分配的元素类型所占字节数这里是sizeof(int)。

00382a3c 分配该类型元素的个数。

到这里也可以明白为什么动态分配一个数组int* p=new int[5] 只需要delete []p 就可以了因为结构体保存了元素个数

随便再说一下对于CD，CC只针对于还未使用过的内存比如像栈这种动态收缩的结构同一个内存不同时刻会存放不同的变量在使用后回收时只改变栈顶指针数据是还在的所以不是CC。