kingofark's Ineffective CC++：自白2：有符号、无符号还有位运算，我的天！

技术2022-05-11 401

Ineffective C/C++ : The Confession of A Novice《Ineffective C/C++ ：一个低手的自白》

by K ][ N G of @ R K

[声明：kingofark并非高手，在论述中所举的例子未必就可取，也未必就是很好的做法。所有例子仅仅是为了说明某些问题，并不具有代表性。kingofark自知才浅，欢迎大家提出批评，指出错误。]

Item 2: Signed and Unsigned and Bit Operation, oh my!自白2：有符号、无符号还有位运算，我的天！

[问题]：这个函数有什么问题吗？

//** * 本函数将两个16比特位的值连结成为一个32比特位的值。 * 参数：sHighBits 高16位 * sLowBits 低16位 * 返回：32位值 **/long CatenateBits16(short sHighBits, short sLowBits){ long lResult = 0; /* 32位值的临时变量*/ /* 将第一个16位值放入32位值的高16位 */ lResult = sHighBits; lResult <<= 16; /* 清除32位值的低16位 */ lResult &= 0xFFFF0000; /* 将第二个16位值放入32位值的低16位 */ lResult |= (long)sLowBits; return lResult;}/

[问题的发现]：

我们先看如下测试代码：

/int main(){ short sHighBits1 = 0x7fff; short sHighBits2 = 0x8f12; unsigned short usHighBits3 = 0xff12; short sLowBits1 = 0x7bcd; long lResult = 0; printf("[sHighBits1 + sLowBits1]/n"); lResult = CatenateBits16(sHighBits1, sLowBits1); printf("lResult = x/n", lResult, lResult); lResult = CatenateBits16(sHighBits2, sLowBits1); printf("lResult = x/n", lResult, lResult); lResult = CatenateBits16(usHighBits3, sLowBits1); printf("lResult = x/n", lResult, lResult); }/

运行结果为：

[sHighBits1 + sLowBits1]lResult = 7fff7bcdlResult = 8f127bcdlResult = ff127bcd

嗯，运行很正确嘛……于是我们就放心的在自己的程序中使用起这个函数来了。

可是忽然有一天，我们的一个程序无论如何结果都不对！经过n个小时的检查和调试，最后终于追踪到……CatenateBits16() ！？它的返回值居然是错的！！

“郁闷！”你说，“这个函数怎么会有问题呢！？”

可是，更郁闷的还在后头呢，因为你把程序中的输入量作为参数，在一个简单的main()里面单步调试：

/int main(){ short sHighBits1 = 0x7FFF; short sHighBits2 = 0x8F12; unsigned short usHighBits3 = 0x8F12; short sLowBits1 = 0x7BCD; //你实际使用的参数 short sLowBits2 = 0x8BCD; //你实际使用的参数 long lResult = 0; printf("[sHighBits1 + sLowBits1]/n"); lResult = CatenateBits16(sHighBits1, sLowBits1); printf("lResult = x/n", lResult, lResult); lResult = CatenateBits16(sHighBits2, sLowBits1); printf("lResult = x/n", lResult, lResult); lResult = CatenateBits16(usHighBits3, sLowBits1); printf("lResult = x/n", lResult, lResult); printf("/n[sHighBits1 + sLowBits2]/n"); lResult = CatenateBits16(sHighBits1, sLowBits2); printf("lResult = x/n", lResult, lResult); lResult = CatenateBits16(sHighBits2, sLowBits2); printf("lResult = x/n", lResult, lResult); lResult = CatenateBits16(usHighBits3, sLowBits2); printf("lResult = x/n", lResult, lResult); return 0;}/

发现结果竟然是：

[sHighBits1 + sLowBits1]lResult = 7fff7bcdlResult = 8f127bcdlResult = 8f127bcd

[sHighBits1 + sLowBits2]lResult = ffff8bcd //oops!lResult = ffff8bcd //oops!lResult = ffff8bcd //oops!

前一次还好好的，后一次就ffff了？X档案？

[X档案的真相]：

注意那两个我们用来当作低16位值的sLowBits1和sLowBits2。

已知：使用 sLowBits1 = 0x7bcd 时，函数返回正确的值；使用 sLowBits2 = 0x8bcd 时，函数中发生X档案。

那么，sLowBits1与sLowBits2有什么区别？

注意了，sLowBits1和sLowBits2都是short型（而不是unsigned short），所以在这里，sLowBits1代表一个正数值，而sLowBits2却代表了一个负数值（因为8即是二进制1000，sLowBits2最高位是1）。

再看CatenateBits16()函数：

/long CatenateBits16(short sHighBits, short sLowBits){ long lResult = 0; /* 32位值的临时变量*/ /* 将第一个16位值放入32位值的高16位 */ lResult = sHighBits; lResult <<= 16; /* 清除32位值的低16位 */ lResult &= 0xFFFF0000; /* 将第二个16位值放入32位值的低16位 */ lResult |= (long)sLowBits; //注意这一句！！！！ return lResult;}/

如果我们在函数中用

printf("sLowBits = x/n", sLowBits);

打印传入的sLowBits值，会发现

sLowBits = 0x7bcd 时，打印结果为

sLowBits = 7bcd

而sLowBits = 0x8bcd时，打印结果为

sLowBits = ffff8bcd

是的，即使用x也打印出8位十六进制。

因此，我们看出来了：

当sLowBits = 0x8bcd时，函数中 "lResult |= (long)sLowBits;" 这一句执行，会先将sLowBits转换为

0xffff8bcd

再与lResult做或运算。由于现在lResult的值为 0xXXXX0000 （其中XXXX是任何值），所以显然，无论sHighBits是什么值，最后结果都会是

0xffff8bcd

而当sLowBits = 0x7bcd时，函数中 "lResult |= (long)sLowBits;" 这一句执行，会先将sLowBits转换为

0x00007bcd

再与lResult做或运算。这样做或运算出来的结果当然就是对的。

也就是说，CatenateBits16()在sLowBits的最高位为0的时候表现正常，而在最高位为1的时候出现偏差。

[教训：在某些情况下作位运算和位处理的时候，考虑使用无符号数值——因为这个时候往往不需要处理符号。即使你需要的有符号的数值，那么也应该考虑自行在调用CatenateBits16()前后做转换——毕竟在位处理中，有符号数值相当诡异！]

下面这个CatenateBits16()版本应该会好一些：

/unsigned long CatenateBits16(unsigned short sHighBits, unsigned short sLowBits){ long lResult = 0; /* 将第一个16位值放入32位值的高16位 */ lResult = sHighBits; lResult <<= 16; /* 清除32位值的低16位 */ lResult &= 0xFFFF0000; /* 将第二个16位值放入32位值的低16位 */ lResult |= (long)sLowBits & 0x0000FFFF; return lResult;}/

注意其中的 "lResult |= (long)sLowBits & 0x0000FFFF;"。事实上，现在即使我们把CatenateBits16()函数的参数（特别是sLowBits）声明为short，结果也会是对的。

[kingofark的收获]：

如果有一天你把一只兔子扔给一只老虎，老虎把兔子吃了，第二天把一只老鼠扔给它，它又吃了，那么说明第一天你看错了：它本来就是一只猫。

专利

最新回复(0)