博客 - Tony Bai

走马观花ANSI C标准-类型表示

八月 19, 2005

0 条评论

类型表示(representation of types)

1、一般规则
a) 除了位域(bit field)之外的对象都是由一个或多个相邻序列字节组成的，这些字节的个数(number)、次序(order)和编码方式或是显式说明的，或是实现定义的。

b) 存储在非符号位域(unsigned bit field)和unsigned char类型对象中的值应该用纯二进制表示(pure binary notation)。(这里就可以理解为符号位当作普通二进制位看)

c) 存储在非位域的其他类型对象的值由n字节组成，这个值可以被拷贝到一个unsigned char[n]类型的对象中去。[注1]

2、整型
a) 对于无符号整型(而不是unsigned char)，用于表示对象的位应分为两组：值位(value bits)和补充位(padding bits)。补充位的值是不确定的。

b) 对于有符号整型，用于表示对象的位应分为三组：值位(value bits)和补充位(padding bits)和符号位(sign bit)。这种类型应恰好有一位符号位，补充位不必要。

c) 整型的精度是指用来表示对象值所用的bit位数，不包括符号位和补充位。整型的宽度也是指用来表示对象值所用的bit位数，但它包含符号位。对于unsign整型来说其精度和宽度是相同的。

3、兼容类型(compatible type)和复合类型(composite type)
在平时的C语言使用中，我们几乎没提到过这两个概念，这里对这两个概念作简单解释：
兼容类型用来在不同翻译单元间检查类型兼容性；
复合类型产生的原因是由于这样的情况“在同一namespace和同一scope中，同一个标识符的声明不止一个”。

E.G.
void f();
void f(int p1[], const int p2, float * p3);
void f(int p1[2], int p2, float * p3);
Composite type is: void f(int p1[2], int p2, float *p3);

如果两个类型相同，则两个类型兼容。在这一规则背后隐藏着的含义是“兼容类型总是有着相同的表示(representation)和对齐(alignment)需求”。
关于兼容类型，标准中说了不少，不过觉得在使用时对之少有问津，所以到这就“浅尝辄止”了:)。

[注1]
也是由于这点，下面这个函数工作良好。
void dump_mem(const void *p, size_t size) {
unsigned char *c = (unsigned char*)p;
size_t i;

YOUR_ASSERT(p != NULL);

        for (i = 0; i < size; i++) {
                printf("%02X ", c[i]);
        }

printf("\t|");

        for (i = 0; i < size; i++) {
               if(isprint(c[i])) {
                    printf("%c ", c[i]);
               }
        }
        printf("\n");
}

用法：
int i = 0×45674142;
dump_mem(&i, sizeof(i));

输出：
42 41 67 45 |B A g E /* 在WinXP , MingW Gcc3.4.2 */
45 67 41 42 |E g A B /* 在Solaris, Gcc3.2 */

分析“参数传递”

八月 12, 2005

0 条评论

翻看以前的一次jjhou的“高阶C”课程的ppt，突然想到今天指导新员工时，她犯的关于参数传递方面的错误，就想简单分析一下。

一、现象和经验
规则：任何时候你想在函数内修改某个外面的变量值，并影响Caller，你应该传递该变量的地址进去。如果是指针变量，也不例外。

a) 反例1
void test(int a) {
a = a + 10;
}
int main() {
int cnt = 0;
test(cnt);
assert(cnt == 10); /* assert dump error */
}

反例1的更正：
就如同上面的“规则”，如果你想在test内部改变cnt的值，你应该传cnt的地址。
int main() {
int cnt = 0;
test(&cnt);
assert(cnt == 10); /* ok */
}
当然这时test的原型要改变一下，实现也应修改。
void test(int *a) {
*a = *a + 10;
}

b) 反例2
void test(char *p) {
p = malloc(128);
}
int main() {
char *buf = NULL;
test(buf);
assert(buf != NULL); /* assert dump error */
}

反例2的更正：
就如同上面的“规则”所说指针也不例外，如果你想在test内部改变指针buf的值，你应该传buf的地址。
int main() {
char *buf = NULL;
test(&buf);
assert(buf != NULL); /* ok */
}
当然这时test的原型要改变一下，实现也应修改。
void test(char **p) {
*p = malloc(128);
}

二、本质分析
C在进行函数参数传递的时候，实际的参数值被复制到被调函数局部的存储区中。由于在blog中不便于用图形分析，这里就是用伪码简单分析一下：

下面用伪码分析上面的反例1:
void test(int a) {
a = a + 10;
}

test(cnt);
=>
test(cnt) {
int _a = cnt; //实际的参数值cnt被复制到被调函数局部的存储区,这里用_a表示test的一个局部存储变量
_a = _a + 10;
}
一看便知cnt的值并未被修改。

再对比一下反例1改正后的伪码：
void test(int *a) {
*a = *a + 10;
}

test(&cnt);
=>
test(&cnt) {
int *_a = &cnt; //_a表示test的一个局部存储变量，而_a复制的是外部变量的地址，
//这样就可通过该地址自由修改外部变量的值了

*_a = *a + 10; //通过指向cnt地址的指针修改了cnt的值。
}