CString 类是我们经常用到的类,所以有必要对它的内存管理模式分析一下.内存管理的演变过程如下: VC5 单纯的使用new delete方法。因为字符串操作需要频繁调整内存大小.而采用C++操作符 new 与 delete是没有与realloc相应功能的。结果就是每一次的改变内存大小都需要额外增加一次拷贝操作。而 new 与delete 在实现中在进程堆中分配。频繁地在堆上进行小内存分配与释放必然在堆上产生大量碎片。堆碎片过多直接影响了程序效率。于是MFC在VC6版本对此进行了改进。 VC6 对于大于512字节的内存和DEBUG模式下,CString仍然使用 new 和 delete来操纵。在Release模式下不大于512字节的内存分配操作采用了内存池管理。并将之细分为 <=64, <=128, <=256, <=512 字节4个内存池管理。这样在不大于512字节的情况下CString有了很好的效率。但是传说中有解决一个BUG就会产生另外一个BUG的定律。 CString 显然也无法避免它。于是在VC7中又改了。
VC7 恢复使用C 的内存管理调用方式。即采用 alloc, free, realloc. CString存在的问题就是由于new与delete没有realloc重新调整内存大小的功能。之前产生的问题导致最终还是采用了C的管理方法。在VC6中为了解决CString小内存操纵的性能问题 MFC在Release版本下对于不大于512字节的内存分配采用的内存池管理来进行优化。其他情况下仍旧使用new 与delete.Release版本下CString在处理不大于512Byte字串的内存时调用如下VC6 中CString 分配内存与释放内存调用次序如下CString::AllocBuffer CFixedAlloc::Alloc CPlex::CreateCString::FreeData CFixedAlloc::Free 相关代码引用如下:FILE:MFC/SRC/STRCORE.CPPvoid CString::AllocBuffer(int nLen) //用来分配内存{... #ifndef _DEBUG // 在Release 版本并且是不大于512字节 if (nLen <= 64){ pData = (CStringData*)_afxAlloc64.Alloc(); pData- >nAllocLength = 64;} else 分别为 <= 1128, <=256 , <=512{ ... } else #endif // DEBUG 和Release下大于512的{ pData = (CStringData*) new BYTE[sizeof(CStringData) + (nLen+1)*sizeof(TCHAR)]; pData- >nAllocLength = nLen;} ... }void FASTCALL CString::FreeData(CStringData* pData) // 释放内存{#ifndef _DEBUG 在Release 版本并且是不大于512字节 int nLen = pData- >nAllocLength; if (nLen == 64) // 根据内存大小分别调用管理器 _afxAlloc64.Free(pData); else if (nLen == 128) _afxAlloc128.Free(pData); else if (nLen == 256) _afxAlloc256.Free(pData); else if (nLen == 512) _afxAlloc512.Free(pData); else { ASSERT(nLen > 512); delete[] (BYTE*)pData; } #else // DEBUG 和Release下大于512的 delete[] (BYTE*)pData; #endif}_afxAlloc[64,128,256,512] 是CFixedAlloc类的全局对象。我们分析一下CFixedAlloc是整样进行内存池管理的它在使用中又产生了什么问题?class CFixedAlloc //定义在 MFC/SRC/FIXALLOC.H文件中{public: CFixedAlloc(UINT nAllocSize, UINT nBlockSize = 64); UINT GetAllocSize() { return m_nAllocSize; } public: void* Alloc(); //分配 由CString调用 void Free(void* p); //释放 由CString调用 void FreeAll(); //释放所有 被析构函数调用 public: ~CFixedAlloc(); protected: struct CNode{//这个是用来实现一个单向链表 CNode* pNext; }; UINT m_nAllocSize; // 需要分配对象的大小仅由构造函数传入 UINT m_nBlockSize; // 预分配的数目即池的大小,由构造函数赋予,可知默认为64 CPlex* m_pBlocks; // 池的链表指针。CPlex对象含有一个CPlex* pNext指针对象, CNode* m_pNodeFree; // 被释放块链表的头指针,实际是应看做可用内存块链表 CRITICAL_SECTION m_protect;//临界区对象 };/*在Alloc的实现中我们可以看到,当池中没有可用块的时候 调用 CPlex::Create建立一块 m_nAllocSize * m_nBlockSize的内存池 如果有的话则从m_pNodeFree中弹出一块来使用 */void* CFixedAlloc::Alloc(){ if (m_pNodeFree == NULL){ //如果没有可用的内存块就进行分配一个池 CPlex* pNewBlock = NULL; TRY { // 分配内存块 默认是64个m_nAllocSize. pNewBlock = CPlex::Create(m_pBlocks, m_nBlockSize, m_nAllocSize); } CATCH_ALL(e) { ...异常 }END_CATCH_ALL // 下面的代码是将内存块压入m_pNodeFree链表中待用。 CNode* pNode = (CNode*)pNewBlock- >data(); (BYTE* &)pNode += (m_nAllocSize * m_nBlockSize) - m_nAllocSize; for (int i = m_nBlockSize-1; i >= 0; i--, (BYTE*&)pNode -= m_nAllocSize) { pNode- >pNext = m_pNodeFree; m_pNodeFree = pNode; } } // 这两句是弹出一块内存给调用者使用。 void* pNode = m_pNodeFree; m_pNodeFree = m_pNodeFree- >pNext;... return pNode; }/*当调用者调用Free时,只是将这块内存重新压入m_pNodeFree链表中 并非释放,而是标志为可用块以待后用。 */void CFixedAlloc::Free(void* p){if (p != NULL) { EnterCriticalSection( &m_protect);CNode* pNode = (CNode*)p; pNode- >pNext = m_pNodeFree;m_pNodeFree = pNode; LeaveCriticalSection( &m_protect);} }void CFixedAlloc::FreeAll(){EnterCriticalSection( &m_protect);m_pBlocks- >FreeDataChain();m_pBlocks = NULL; m_pNodeFree = NULL; LeaveCriticalSection( &m_protect);}/*在析构函数中 调用FreeAll进行释放内存 */CFixedAlloc::~CFixedAlloc(){FreeAll(); DeleteCriticalSection( &m_protect);}/*MFC/INCLUDE/AFXPLEX_.H */struct CPlex // warning variable length structure{CPlex* pNext; void* data() { return this+1; } static CPlex* PASCAL Create(CPlex* & head, UINT nMax, UINT cbElement);void FreeDataChain(); // free this one and links };/*MFC/SRC/PLEX.CPP */CPlex* PASCAL CPlex::Create(CPlex*& pHead, UINT nMax, UINT cbElement){CPlex* p = (CPlex*) new BYTE[sizeof(CPlex) + nMax * cbElement]; p- >pNext = pHead;pHead = p; // 加入链表 return p; }void CPlex::FreeDataChain() // free this one and links{CPlex* p = this; while (p != NULL){ BYTE* bytes = (BYTE*) p; CPlex* pNext = p- >pNext;delete[] bytes; p = pNext; } }现在我们用一个实例来看一下在Release版本下的实际内存动作以分配10000个含有"abcdefghijklmnopqrstuvwxyz"串的CString数组CString * strArray[10000];for( int =0;i < 10000; i++ )strArray[i] = new CString( "abcdefghijklmnopqrstuvwxyz");//因为字符串小于64所以用了_afxAlloc64::Alloc;_afxAlloc64在STRCORE.CPP中被定义如下:AFX_STATIC CFixedAlloc _afxAlloc64(ROUND4(65*sizeof(TCHAR)+sizeof(CStringData)));在ANSI版本下 sizeof(TCHAR) = 1sizeof( CStrginData ) = 12;65*sizeof(TCHAR)+sizeof(CStringData) = 77;ROUND4定义用下,将之圆整为4的倍数,#define ROUND(x,y) (((x)+(y-1))&~(y-1))#define ROUND4(x) ROUND(x, 4)所以_afxAlloc64(ROUND4(65*sizeof(TCHAR)+sizeof(CStringData))) 实际上宏展开最终为 extern CFixedAlloc _afxAlloc64( 80,64);在CPlex中分配池的大小sizeof(CPlex) + nMax * cbElement = 4+80*64 = 5124 BYTE.因为10000不是64的整数倍 = 要分配157个池实际分配内存 = 157*5124 = 804468 BYTE = 804KB.释放CString对象for( int =0;i < 10000; i++ )delete strArray[i];此时CString 的调用_afxAlloc64.Free.由CFixedAlloc::Free的实现可知此时并没有真正释放内存,只是将这该块重新加入m_pNodeFree链表中待用.因为CFixedAlloc释放内存操作是在析构函数调用,而_afxAlloc64是被定义为全局对象.它的析构函数要到程序退出才能被调用.所以CFixedAlloc分配的内存在程序结束之前只会增加而不能回收.而如果我们重新分配10000个 字符串 >64 <=128的的CString对象时_afxAlloc64的内存占用依旧,而_afxAlloc128则重新分配了 157*(4+144*64) = 157*9220=1447540= 1.44754MB再释放它,此时内存占用则为 1.44754MB+804KB = 2.252008MB.与使用char*对象做比较:char* chArray[10000];分配 "abcdefghijklmnopqrstuvwxyz" 实际内存是 27*10000 = 270KB释放后内存即被回收再分配128字串 10000个 内存是 129*10000 = 1.29MB.释放后内存即被回收
结论:VC6中的CString采用内存池技术在改进小内存new与delete的性能与堆碎片问题后又产生了一个不是内存泄露的内存泄露。其实VC5,VC6中CString产生的问题是因为教条地遵守C++应当采用new与delete来管理内存的规则造成的最终在VC7中 CString仍旧回到使用C方法上.
