char wchar

    技术2025-05-05  14

    char wchar等字符类型比较 2010-08-30 16:31 char :单字节变量类型,最多表示256个字符,

    wchar_t :宽字节变量类型,用于表示Unicode字符,

    它实际定义在<string.h>里:typedef unsigned short wchar_t。

    为了让编译器识别Unicode字符串,必须以在前面加一个“L”,定义宽字节类型方法如下:

        wchar_t c = `A' ; wchar_t * p = L"Hello!" ; wchar_t a[] = L"Hello!" ;

    其中,宽字节类型每个变量占用2个字节,故上述数组a的sizeof(a) = 14

    TCHAR / _T( ) : 如果在程序中既包括ANSI又包括Unicode编码,需要包括头文件tchar.h。TCHAR是定义在该头文件中的宏,它视你是否定义了_UNICODE宏而定义成: 定义了_UNICODE:    typedef wchar_t TCHAR ; 没有定义_UNICODE: typedef char TCHAR ;

    #ifdef UNICODE typedef char TCHAR; #else typede wchar_t TCHAR; #endif _T( )也是定义在该头文件中的宏,视是否定义了_UNICODE宏而定义成: 定义了_UNICODE:    #define _T(x) L##x 没有定义_UNICODE: #define _T(x) x 注意:如果在程序中使用了TCHAR,那么就不应该使用ANSI的strXXX函数或者Unicode的wcsXXX函数了,而必须使用tchar.h中定义的_tcsXXX函数。

    以strcpy函数为例子,总结一下:

    Code //如果你想使用ANSI字符串,那么请使用这一套写法: char szString[100]; strcpy(szString,"test"); //如果你想使用Unicode字符串,那么请使用这一套: wchar_t szString[100]; wcscpy(szString,L"test"); //如果你想通过定义_UNICODE宏,而编译ANSI或者Unicode字符串代码: TCHAR szString[100]; _tcscpy(szString,_TEXT("test"));

    :superarhow说: 不要再使用TCHAR和_T了!他分析了原因后总结:如 果您正开始一个新的项目,请无论如何也要顶住压力,直接使用UNICODE编码!切记!您只需要对您的组员进行10分钟的培训,记住strcpy用 wcscpy,sprintf用swprintf代替,常数前加L,就可以了!它不会花您很多时间的,带给您的是稳定和安全!相信偶,没错的!!

    一、 在字符串前加一个L作用:    如 L"我的字符串"    表示将 ANSI字符串转换成unicode的字符串,就是每个字符占用两个字节。 strlen("asd")   =   3;   strlen(L"asd")   =   6; 二、 _T宏可以把一个引号引起来的字符串,根据你的环境设置,使得编译器会根据编译目标环境选择合适的(Unicode还是ANSI)字符处理方式    如果你定义了UNICODE,那么_T宏会把字符串前面加一个L。这时 _T("ABCD") 相当于 L"ABCD" ,这是宽字符串。    如果没有定义,那么_T宏不会在字符串前面加那个L,_T("ABCD") 就等价于 "ABCD" 三、TEXT,_TEXT 和_T 一样的 如下面三语句:   TCHAR   szStr1[]   =   TEXT("str1");   char   szStr2[]   =   "str2";   WCHAR   szStr3[]   =   L("str3");   那么第一句话在定义了UNICODE时会解释为第三句话,没有定义时就等于第二句话。   但二句话无论是否定义了UNICODE都是生成一个ANSI字符串,而第三句话总是生成UNICODE字符串。   为了程序的可移植性,建议都用第一种表示方法。   但在某些情况下,某个字符必须为ANSI或UNICODE,那就用后两种方法。 四、_T()函数详解 _T("")是一个宏,他的作用是让你的程序支持Unicode编码 因为Windows使用两种字符集ANSI和UNICODE, 前者就是通常使用的单字节方式, 但这种方式处理象中文这样的双字节字符不方便, 容易出现半个汉字的情况。 而后者是双字节方式,方便处理双字节字符。 Windows NT的所有与字符有关的函数都提供两种方式的版本,而Windows 9x只支持ANSI方式。 如果你编译一个程序为ANSI方式, _T实际不起任何作用。 而如果编译一个程序为UNICODE方式,则编译器会把"Hello"字符串以UNICODE方式保存。_T和_L的区别在于,_L不管你是以什么方式编译,一律以UNICODE方式保存。 LPSTR:32bit指针指向一个字符串,每个字符占1字节 LPCSTR:32-bit指针指向一个常字符串,每个字符占1字节 LPCTSTR:32-bit指针指向一个常字符串,每字符可能占1字节或2字节,取决于Unicode是否定义 LPTSTR:32-bit指针每字符可能占1字节或2字节,取决于Unicode是否定义 L是表示字符串资源为Unicode的。 比如 wchar_t Str[] = L"Hello World!"; 这个就是双子节存储字符了。 _T是一个适配的宏~ 当 #ifdef _UNICODE的时候 _T就是L 没有#ifdef _UNICODE的时候 _T就是ANSI的。 比如 LPTSTR lpStr = new TCHAR[32]; TCHAR* szBuf = _T("Hello"); 以上两句使得无论是在UNICODE编译条件下都是正确编译的。 而且MS推荐你使用相匹配的字符串函数。 比如处理LPTSTR或者LPCTSTR 的时候,不要用strlen ,而是要用_tcslen 否则在UNICODE的编译条件下,strlen不能处理 wchar_t*的字符串。 T是非常有意思的一个符号(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一种中间类型,既不明确表示使用 MBCS,也不明确表示使用 UNICODE。那到底使用哪种字符集?编译的时候才决定

    最新回复(0)