C++咬文嚼字-'Pointer Trick'

五月 22, 2007

0 条评论

晚上饭后抽空看了看如何实现一个内存管理器，涉及内存操作必定少不了指针，恰研究到offsetof这个operator，也看了它的实现，顿有所悟。

先看一段代码：
struct Foo {
        int     a;
        char*   p;
        char    b;
};

Foo* p1 = reinterpret_cast(0);
Foo* p2 = 0;

bool b = (p1 == p2);
std::cout << b << std::endl;

输出结果：
1

请考虑一下虽然打印出来的结果是：1，但是这两个赋值语句的意义相同吗？？？

Foo* p2 = 0;
相信所有C++的初学者都知道，这句的意思是p2是一个空指针，或者说p2尚未指向任何对象。

Foo* p1 = reinterpret_cast(0);
那么这句呢？难道p1也是如p2一样，是一个空指针么？

我们再回顾一下一般我们给指针赋值都是如何做的：
Foo* p = new Foo();
或
Foo aFoo;
Foo *p = &aFoo;

无论是new Foo()还是&aFoo，实际上他们返回的都是一个地址常量，类似于0xffbff204这样的地址值，我们就不妨假设new Foo()或&aFoo返回的地址常量值就为0xffbff204。

继续！我们将如何解释一个指针呢？在Stanley B. Lippman的鸿篇巨制'C++ Primer 3rd'中的第3.3小节有这样的叙述：
每个指针都有一个相关的类型。… … 指针的类型可以指示编译器怎样解释特定地址上内存的内容以及该内存区域应该跨越多少内存单元。

好了，我们解释一下Foo *p = 0xffbff204; (或Foo *p = (Foo*)0xffbff204 或Foo *p = reinterpret_cast(0xffbff204) 更好一些，因为Foo *p = 0xffbff204;这样的语句在C++中很可能不能通过编译，并提示'invalid conversion from `unsigned int' to `Foo*'之类的错误')
我们有这样一个Foo类型的指针，其指向一个起始地址为0xffbff204的类型为Foo的对象，这样我们可以通过&(p->b)得到b的地址：即在0xffbff204的基础上再加上成员b在结构体中的偏移量，如偏移量是8，我们得到的b的地址就是0xffbff204 + 8d。

现在我们把0xffbff204换成了0，也就是Foo* p1 = reinterpret_cast(0); 其实我们再告诉编译器：我们有这样一个Foo类型的指针，其指向一个起始地址为0×0的类型为Foo的对象。这时如果我们想得到b的地址，我们一样可以通过&(p->b)获得，即在0×0的基础上再加上成员b在结构体中的偏移量，如偏移量是8，我们得到的b的地址就是0×0+ 8d = 8，其实这就是b在结构体里面的偏移量。

有些人一直在担心，p1指向地址为0处，一旦引用p1会不会出问题，请牢记这里我们并没有做dereference操作，即*p操作，而且获取b的地址实际上编译器是通过p1以及b的偏移量来计算得来的，也不涉及到dereference操作。你也可以理解为有一个'虚拟'的Foo object就存储在0×0这个地址上，呵呵。越过脑子中的那个阴影向前一步便会豁然开朗。

不进一步分析了，一般offsetof的实现如下：
#define offsetof(type, f) ((size_t)((char *)&((type *)0)->f – (char *)(type *)0))
有了上面的阐述相信理解这个宏定义应该不难。

用C++的写法：std::cout << reinterpret_cast<size_t>(&((reinterpret_cast<Foo*>(0))->p)) << std::endl;
不知道上面我的逻辑是否适合大家。^_^