<div id="navCategory"></div><p>最近在项目中遇到了一个编译警告,是因为定义的变量为char[],而在使用时作为函数的unsigned char*类型的参数调用。</p>
讯享网
这个警告很容易避免,但是char*和unsigned char*到底有什么区别呢?
在C中,默认的基础数据类型均为signed,如定义变量为int,long等,都为有符号的。如果要定义无符号类型,必须显式地在变量类型前加unsigned。
char vs unsigned char
- 相同点:在内存中都是一个字节,8位(2^8=256),都能表示256个数字
- 不同点:char的最高位为符号位,因此char能表示的数据范围是-128~127,unsigned char没有符号位,因此能表示的数据范围是0~255
实际使用中,如普通的赋值,读写文件和网络字节流都没有区别,不管最高位是什么,最终的读取结果都一样,在屏幕上面的显示可能不一样。
但是要把一个char类型的变量赋值给int、long等数据类型或进行类似的强制类型转换时时,系统会进行类型扩展,这时区别就大了。对于char类型的变量,系统会认为最高位为符号位,然后对最高位进行扩展,即符号扩展。若最高位为1,则扩展到int时高位都以1填充。
对于unsigned char类型的变量,系统会直接进行无符号扩展,即0扩展。扩展的高位都以0填充。所以在进行类似的操作时,如果char和unsigned char最高位都是0,则结果是一样的,若char最高位为1,则结果会大相径庭。
可以使用的下面的小程序验证一下:
运行结果如下:
%c: �, �
%x: ffffff80, 80
, 128
%d: -128, 128
---------------------------
%c:,
%x: 7f, 7f
ᤒ7, 127
%d: 127, 127
对于char来说,0x80用二进制表示为1000 0000,当它作为char赋值给unsigned int或 int 时,系统认为最高位是符号位,会对最高位进行扩展。而0x7F用二进制表示为0111 1111,最高位为0,不会扩展。
对于unsigned char来说,不管最高位是0,还是1,都不会做扩展。
char* 和 unsigned char* 也具有类似的区别,如下面测试程序所示:
输出结果为:
sizeof(i) = 4
sizeof(a) = 2
-----------------------------
begin p(char):
a = | -12345
0xffffffc7 0xffffffcf
i = | -1
0xffffffff 0xffffffff 0xffffffff 0xffffffff
-1 > 0u: true
-----------------------------
begin q(unsigned char):
a = | -12345
0xc7 0xcf
i = | -1
0xff 0xff 0xff 0xff
-1 > 0u: true
char*是有符号的,如果大于127即0x7F的数就是负数了,使用%x格式化输出,系统自动进行了符号扩展,就会产生变化。
所以在涉及到类型提升的上下文中,要注意使用char*和unsinged char*的区别。
1.char*是有符号的, 如果大于127即0x7F的数就是负数了,使用%x格式化输出,就会产生变化,所以使用%x格式化输出数据时,记得一定要转换成无符号类型;
2.char *是字符串,以'/0'为结束符,unsigned char *是普通的指针;
3.有符号的字符型数据C7,CF分别传入printf,此时会将类型提升为int,由于是有符号数,所以符号位要进行扩展,得到FFFFFFCF和FFFFFFC7。无符号的字符型数据C7,CF分别传入printf,此时会将类型提升为unsigned int,由于无符号数不进行符号位扩展,所以得到000000CF和00000C7。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/177815.html