kingofark's Ineffective CC++:自白2:有符号、无符号还有位运算,我的天!

    技术2022-05-11  184

    Ineffective C/C++ : The Confession of A Novice《Ineffective C/C++ :一个低手的自白》

    by K ][ N G of @ R K

    [声明:kingofark并非高手,在论述中所举的例子未必就可取,也未必就是很好的做法。所有例子仅仅是为了说明某些问题,并不具有代表性。kingofark自知才浅,欢迎大家提出批评,指出错误。]

    Item 2: Signed and Unsigned and Bit Operation, oh my!自白2:有符号、无符号还有位运算,我的天!

    [问题]:这个函数有什么问题吗?

    //** * 本函数将两个16比特位的值连结成为一个32比特位的值。 * 参数:sHighBits 高16位 *       sLowBits  低16位 * 返回:32位值 **/long CatenateBits16(short sHighBits, short sLowBits){    long lResult = 0; /* 32位值的临时变量*/        /* 将第一个16位值放入32位值的高16位 */    lResult = sHighBits;    lResult <<= 16;        /* 清除32位值的低16位 */    lResult &= 0xFFFF0000;        /* 将第二个16位值放入32位值的低16位 */    lResult |= (long)sLowBits;        return lResult;}/

    [问题的发现]:

    我们先看如下测试代码:

    /int main(){    short           sHighBits1  = 0x7fff;    short           sHighBits2  = 0x8f12;    unsigned short  usHighBits3 = 0xff12;    short           sLowBits1   = 0x7bcd;        long            lResult  = 0;        printf("[sHighBits1 + sLowBits1]/n");        lResult = CatenateBits16(sHighBits1, sLowBits1);    printf("lResult = x/n", lResult, lResult);         lResult = CatenateBits16(sHighBits2, sLowBits1);    printf("lResult = x/n", lResult, lResult);        lResult = CatenateBits16(usHighBits3, sLowBits1);    printf("lResult = x/n", lResult, lResult);   }/

    运行结果为:

    [sHighBits1 + sLowBits1]lResult = 7fff7bcdlResult = 8f127bcdlResult = ff127bcd

    嗯,运行很正确嘛……于是我们就放心的在自己的程序中使用起这个函数来了。

    可是忽然有一天,我们的一个程序无论如何结果都不对!经过n个小时的检查和调试,最后终于追踪到……CatenateBits16() !?它的返回值居然是错的!!

    “郁闷!”你说,“这个函数怎么会有问题呢!?”

    可是,更郁闷的还在后头呢,因为你把程序中的输入量作为参数,在一个简单的main()里面单步调试:

    /int main(){    short           sHighBits1  = 0x7FFF;    short           sHighBits2  = 0x8F12;    unsigned short  usHighBits3 = 0x8F12;        short           sLowBits1  = 0x7BCD; //你实际使用的参数    short           sLowBits2  = 0x8BCD; //你实际使用的参数        long            lResult  = 0;        printf("[sHighBits1 + sLowBits1]/n");        lResult = CatenateBits16(sHighBits1, sLowBits1);    printf("lResult = x/n", lResult, lResult);         lResult = CatenateBits16(sHighBits2, sLowBits1);    printf("lResult = x/n", lResult, lResult);        lResult = CatenateBits16(usHighBits3, sLowBits1);    printf("lResult = x/n", lResult, lResult);           printf("/n[sHighBits1 + sLowBits2]/n");        lResult = CatenateBits16(sHighBits1, sLowBits2);    printf("lResult = x/n", lResult, lResult);         lResult = CatenateBits16(sHighBits2, sLowBits2);    printf("lResult = x/n", lResult, lResult);        lResult = CatenateBits16(usHighBits3, sLowBits2);    printf("lResult = x/n", lResult, lResult);         return 0;}/

    发现结果竟然是:

    [sHighBits1 + sLowBits1]lResult = 7fff7bcdlResult = 8f127bcdlResult = 8f127bcd

    [sHighBits1 + sLowBits2]lResult = ffff8bcd          //oops!lResult = ffff8bcd          //oops!lResult = ffff8bcd          //oops!

    前一次还好好的,后一次就ffff了?X档案?

    [X档案的真相]:

    注意那两个我们用来当作低16位值的sLowBits1和sLowBits2。

    已知:使用 sLowBits1 = 0x7bcd 时,函数返回正确的值;使用 sLowBits2 = 0x8bcd 时,函数中发生X档案。

    那么,sLowBits1与sLowBits2有什么区别?

    注意了,sLowBits1和sLowBits2都是short型(而不是unsigned short),所以在这里,sLowBits1代表一个正数值,而sLowBits2却代表了一个负数值(因为8即是二进制1000,sLowBits2最高位是1)。

    再看CatenateBits16()函数:

    /long CatenateBits16(short sHighBits, short sLowBits){    long lResult = 0; /* 32位值的临时变量*/        /* 将第一个16位值放入32位值的高16位 */    lResult = sHighBits;    lResult <<= 16;        /* 清除32位值的低16位 */    lResult &= 0xFFFF0000;        /* 将第二个16位值放入32位值的低16位 */    lResult |= (long)sLowBits;     //注意这一句!!!!        return lResult;}/

    如果我们在函数中用

    printf("sLowBits = x/n", sLowBits);

    打印传入的sLowBits值,会发现

    sLowBits = 0x7bcd 时,打印结果为

    sLowBits = 7bcd

    而sLowBits = 0x8bcd时,打印结果为

    sLowBits = ffff8bcd

    是的,即使用x也打印出8位十六进制。

    因此,我们看出来了:

    当sLowBits = 0x8bcd时,函数中 "lResult |= (long)sLowBits;" 这一句执行,会先将sLowBits转换为

    0xffff8bcd

    再与lResult做或运算。由于现在lResult的值为 0xXXXX0000 (其中XXXX是任何值),所以显然,无论sHighBits是什么值,最后结果都会是

    0xffff8bcd

    而当sLowBits = 0x7bcd时,函数中 "lResult |= (long)sLowBits;" 这一句执行,会先将sLowBits转换为

    0x00007bcd

    再与lResult做或运算。这样做或运算出来的结果当然就是对的。

    也就是说,CatenateBits16()在sLowBits的最高位为0的时候表现正常,而在最高位为1的时候出现偏差。

    [教训:在某些情况下作位运算和位处理的时候,考虑使用无符号数值——因为这个时候往往不需要处理符号。即使你需要的有符号的数值,那么也应该考虑自行在调用CatenateBits16()前后做转换——毕竟在位处理中,有符号数值相当诡异!]

    下面这个CatenateBits16()版本应该会好一些:

    /unsigned long CatenateBits16(unsigned short sHighBits, unsigned short sLowBits){    long lResult = 0;        /* 将第一个16位值放入32位值的高16位 */    lResult = sHighBits;    lResult <<= 16;        /* 清除32位值的低16位 */    lResult &= 0xFFFF0000;        /* 将第二个16位值放入32位值的低16位 */    lResult |= (long)sLowBits & 0x0000FFFF;        return lResult;}/

    注意其中的 "lResult |= (long)sLowBits & 0x0000FFFF;"。事实上,现在即使我们把CatenateBits16()函数的参数(特别是sLowBits)声明为short,结果也会是对的。

    [kingofark的收获]:

    如果有一天你把一只兔子扔给一只老虎,老虎把兔子吃了,第二天把一只老鼠扔给它,它又吃了,那么说明第一天你看错了:它本来就是一只猫。


    最新回复(0)