char wchar

技术2025-05-05 80

char wchar等字符类型比较 2010-08-30 16:31 char :单字节变量类型，最多表示256个字符，

wchar_t :宽字节变量类型，用于表示Unicode字符，

它实际定义在<string.h>里：typedef unsigned short wchar_t。

为了让编译器识别Unicode字符串，必须以在前面加一个“L”,定义宽字节类型方法如下：

wchar_t c = `A' ; wchar_t * p = L"Hello!" ; wchar_t a[] = L"Hello!" ;

其中，宽字节类型每个变量占用2个字节，故上述数组a的sizeof(a) = 14

TCHAR / _T( ) : 如果在程序中既包括ANSI又包括Unicode编码，需要包括头文件tchar.h。TCHAR是定义在该头文件中的宏，它视你是否定义了_UNICODE宏而定义成：定义了_UNICODE： typedef wchar_t TCHAR ; 没有定义_UNICODE： typedef char TCHAR ;

#ifdef UNICODE typedef char TCHAR; #else typede wchar_t TCHAR; #endif _T( )也是定义在该头文件中的宏，视是否定义了_UNICODE宏而定义成：定义了_UNICODE： #define _T(x) L##x 没有定义_UNICODE： #define _T(x) x 注意：如果在程序中使用了TCHAR，那么就不应该使用ANSI的strXXX函数或者Unicode的wcsXXX函数了，而必须使用tchar.h中定义的_tcsXXX函数。

以strcpy函数为例子，总结一下：

Code //如果你想使用ANSI字符串，那么请使用这一套写法： char szString[100]; strcpy(szString,"test"); //如果你想使用Unicode字符串，那么请使用这一套： wchar_t szString[100]; wcscpy(szString,L"test"); //如果你想通过定义_UNICODE宏，而编译ANSI或者Unicode字符串代码： TCHAR szString[100]; _tcscpy(szString,_TEXT("test"));

:superarhow说：不要再使用TCHAR和_T了！他分析了原因后总结：如果您正开始一个新的项目，请无论如何也要顶住压力，直接使用UNICODE编码！切记！您只需要对您的组员进行10分钟的培训，记住strcpy用 wcscpy，sprintf用swprintf代替，常数前加L，就可以了！它不会花您很多时间的，带给您的是稳定和安全！相信偶，没错的！！

一、在字符串前加一个L作用: 如 L"我的字符串" 表示将 ANSI字符串转换成unicode的字符串，就是每个字符占用两个字节。 strlen("asd") = 3; strlen(L"asd") = 6; 二、 _T宏可以把一个引号引起来的字符串，根据你的环境设置，使得编译器会根据编译目标环境选择合适的（Unicode还是ANSI）字符处理方式如果你定义了UNICODE，那么_T宏会把字符串前面加一个L。这时 _T("ABCD") 相当于 L"ABCD" ，这是宽字符串。如果没有定义，那么_T宏不会在字符串前面加那个L，_T("ABCD") 就等价于 "ABCD" 三、TEXT,_TEXT 和_T 一样的如下面三语句： TCHAR szStr1[] = TEXT("str1"); char szStr2[] = "str2"; WCHAR szStr3[] = L("str3"); 那么第一句话在定义了UNICODE时会解释为第三句话，没有定义时就等于第二句话。但二句话无论是否定义了UNICODE都是生成一个ANSI字符串，而第三句话总是生成UNICODE字符串。为了程序的可移植性，建议都用第一种表示方法。但在某些情况下，某个字符必须为ANSI或UNICODE，那就用后两种方法。四、_T()函数详解 _T("")是一个宏,他的作用是让你的程序支持Unicode编码因为Windows使用两种字符集ANSI和UNICODE，前者就是通常使用的单字节方式，但这种方式处理象中文这样的双字节字符不方便，容易出现半个汉字的情况。而后者是双字节方式，方便处理双字节字符。 Windows NT的所有与字符有关的函数都提供两种方式的版本，而Windows 9x只支持ANSI方式。如果你编译一个程序为ANSI方式， _T实际不起任何作用。而如果编译一个程序为UNICODE方式，则编译器会把"Hello"字符串以UNICODE方式保存。_T和_L的区别在于，_L不管你是以什么方式编译，一律以UNICODE方式保存。 LPSTR：32bit指针指向一个字符串，每个字符占1字节 LPCSTR:32-bit指针指向一个常字符串，每个字符占1字节 LPCTSTR:32-bit指针指向一个常字符串,每字符可能占1字节或2字节，取决于Unicode是否定义 LPTSTR:32-bit指针每字符可能占1字节或2字节，取决于Unicode是否定义 L是表示字符串资源为Unicode的。比如 wchar_t Str[] = L"Hello World!"; 这个就是双子节存储字符了。 _T是一个适配的宏～当 #ifdef _UNICODE的时候 _T就是L 没有#ifdef _UNICODE的时候 _T就是ANSI的。比如 LPTSTR lpStr = new TCHAR[32]; TCHAR* szBuf = _T("Hello"); 以上两句使得无论是在UNICODE编译条件下都是正确编译的。而且MS推荐你使用相匹配的字符串函数。比如处理LPTSTR或者LPCTSTR 的时候，不要用strlen ,而是要用_tcslen 否则在UNICODE的编译条件下，strlen不能处理 wchar_t*的字符串。 T是非常有意思的一个符号（TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...），它表示使用一种中间类型，既不明确表示使用 MBCS，也不明确表示使用 UNICODE。那到底使用哪种字符集?编译的时候才决定

最新回复(0)