标签 编程 下的文章

简析多级指针解引用

指针是C语言中公认的最为强大的语法要素,但同时也是最难理解的语法要素,它曾给程序员带来了无数麻烦和痛苦,以致于在C语言之后诞生的很多新兴 语言中我们再也难觅指针的身影了。

下面是一个最简单的C语言指针的例子:
int a = 5;
int *p = &a;

其中p就是一个指针变量。如果C语言中仅仅存在这类指针,那显然指针不会形成“大患”。经常地我们会在代码中看到下面的情形:

int **q = &p;
int ***z = &q;

随着符号'*'个数的增加,C代码的理解复杂度似乎也曾指数级别增长似的。像q、z这样的指向指针的指针(pointer to pointer to …)变量,中文俗称“多级指针”。不过在一些正式的英文C语言教程中,我没能找到其正式的英文说法。在老外的这些书 中,它们多被称为pointer to pointer (to pointer to ….)。多级指针的确是很难理解的,特别当与函数、数组等联合在一起使用时。今天在写代码时恰好撞见了多级指针,于是就打算在这里说说对多级指针以及 其解引用的一些粗浅理解。

指针究竟是啥?

和普通变量想比,指针变量到底有何不同,究竟何为指针(变量)?我们来看一个例子:

int a = 5;
int *p = &a;

printf("a addr = [%p]\n", &a);
printf("a content = [%d]\n", a);
printf("p addr = [%p]\n", &p);
printf("p content = [%p]\n", p);
printf("*p = [%d]\n", *p);

*p = 6;
printf("after modify, *p = [%d]\n", *p);

编译这个小程序并执行,输出结果如下:

a addr = [0xbfb609b8]
a content = [5]
p addr = [0xbfb609bc]
p content = [0xbfb609b8]
*p = [5]
after modify, *p = [6]

通过两个变量的addr,我们可以看到a、p两个变量都是在栈上分配的变量。不同的是普通整型变量a对应的内存单元(a content)中存储的值为整型值5,是一个数值;而变量p对应的内存单元(p content)中存储的值为0xbfb609b8,是变量a的地址,用栈变量简图可以表示如下:

| …      |
|0xbfb609b8| <- &p [0xbfb609bc]
|5         | <- &a [0xbfb609b8]
| …      |

可以看出指针变量的第一个特点是它是一种以存储其他变量地址为目的的变量。一个T类型的指针变量(一级指针)就是一个存储了某T类 型值变量的地址的内存单元。

例子中最后那个输出是对指针的解引用(dereference)操作,指针的解引用操作的结果是得到指针所指的地址上的变量的值。在这个例子中指 针所指到内存地址为0xbfb609b8,也就是a变量的位置,因此*p的结果为变量a的值,即5。因此我们得到指针变量的第二个特点: 通过对指针的解引用,我们可以获得其指向的内存单元所表示的值。

在例子中,我们看到了这行代码 *p = 6,并发现执行这行代码后,a变量的值变为了6。这就是指针的第三个特点:当解引用作左值时,它可以修改其所指内存地址上变量的值。a被修改后的栈变量分布简图:

| …      |
|0xbfb609b8| <- &p [0xbfb609bc]
|6         | <- &a [0xbfb609b8]
| …      |

二级指针

我们再来分析一下下面的示例程序的输出结果。

int a = 5;
int b = 13;
int *p = &a;
printf("*p = %d\n", *p); 
int **q = &p;
(*q) = &b;
printf("*p = %d\n", *p);

根据前面的分析,第一次*p输出时p指向a的地址,对p解引用的结果就是a所在内存单元的值,即5。接下来的代码分析起来就需要谨慎一些了。我们先来看看 int **q = &p这行代码。根据对一级指针的分析,我们可以将int **q理解成(int*) *q,这样q指向的地址就是一个int*型的变量的内存地址,该地址上的值本身也是一个地址值。在这个例子中,(int*) *q = &p; 也就是说q中存储的值就是变量p的地址。通过*q我们可以得到p中存储的地址值(&a);而若*q作为左值,显然就是修改p中存储的地址值喽,因 此(*q) = &b则相当于p = &b,则第二个*p的输出结果为变量b所在内存单元的值,即13。

在修改*q前,栈上内存布局:

| …      |
|0xbf830ec8| <- &q [0xbf830ecc]
|0xbf830ec0| <- &p [0xbf830ec8]
|11        | <- &b [0xbf830ec4]
|5         | <- &a [0xbf830ec0]
| …      |

在修改*q的值后,栈上内存布局:

| …      |
|0xbf830ec8| <- &q [0xbf830ecc]
|0xbf830ec4| <- &p [0xbf830ec8] /* 通过*q修改 */
|11        | <- &b [0xbf830ec4]
|5         | <- &a [0xbf830ec0]
| …      |

再来分析一下**q的值又是啥呢?有了前面的铺垫:*q <=> p,那**q <=> *(*q) <=> *p,其值自然就明了了,就是b的值。

多级指针

有了一级指针和二级指针的分析打基础,当我们遇到更多*的时候,只是遵循这个方法耐心分析就是了,比如:

int a = 5;
int *p = &a;
int **q = &p;
int ***z = &q;

我们可以对比着前面一、二级指针的理解方法来理解这三个指针p、q和z:
    – 一级指针p自身存储的是整型值变量a的地址,对一级指针解引用(*p)得到的是值变量a的值;*p作左值,修改的是变量a的值;
    – 二级指针q自身存储的是一级整型指针变量p的地址,对二级指针解引用(*q)得到的是一级指针p自身存储的值(a的地址:&a);*p作左值时,修改的一级指针p的指向;
    – 三级指针z自身存储的是二级整型指针变量q的地址,对三级指针解引用(*z)得到的是二级指针q自身存储的值,也就是p的地址(&p);对*z再 解引用(**z),相当于得到p自身存储的值,也就是a的地址&a;对**z再解引用,即***z,相当于得到a自身存储的变量值,即5。用一个 等价式可以更形象的表达:***z <=> **(*z) <=> **q <=> *(*q) <=> *p <=> 5。
    – 更高级别的指针可依次类推。不过如果再对***z解引用,即****z,那则相当于对整型数5(非地址)进行解引用,会出现编译错误: 一元 ‘*’参数类型无效(有‘int’)。

为什么还用C编程?

本文翻译自Dr. Dobb's杂志主编Andrew Binstock的文章“Why Code in C Anymore?”,以下是翻译正文。

传统的那些选择C而不是C++的理由的说服力已经逐渐地被削弱。还有什么继续使用C的更好的理由么?

一个 Dr. Dobb's的老读者最近问我:为何人们还在使用C编程。这个话题最近曾在我们站点的评论中出现过。早期也曾出现在与一些行业公司的对话过程中,尤其是微 软。在C++早期,根据你的需要,你可以有许多使用C或C++的理由;但随着C++的演化,C的大量传统的杰出特性已经变得不那么优越了。考虑到 这些点一般是在比较两门编程语言时首先会被考虑到的,因此我们来一起看一下。

性能。通常我们都认为C++应用的性能要比C的慢。但在大多主流平台上,这个性能上的差距在今天已经变得非常小了。比 如,Alioth上的计算机基准测试报告显示C++(运行在32位Linux上)在运行基准测试时的性能要比C慢27%。其他一些研究结果显示这个差 距或略大或略小些。但在几乎所有例子中,C++都是仅次于C的运行第二快的编程语言。它通常要比运行在JVM和.NET平台上的语言快出很多。因 此,尽管C在基准测试上依旧保持有优势,但对于大多已经可以接受Java性能的应用(比如企业应用或面向客户端的应用)而言,这个差距显得并不是那么重要 了。

普遍性。在嵌入式编程领域,C仍然保持着首选语言的舒适地位,这缘于这样一个事实:每个硬件供货商都会提供一个C编译器。而大家普遍 也认为C++在嵌入式开发方面表现没有那么强势。不过,当今大多提供编程工具的组件供货商也提供了C++编译器。(但PIC微控制器方面继续保持 着例外)。这是一个正在逐渐缩水的好处。

可移植性。C++曾被认为是一个可移植的老大难(实际上在C89标准出台以前,C也是一个老大难)。然而,当今的编译器对C++语 言的核心实现的十分充分,以至于大多软件可以通过重新编译进行移植,不需要什么调整。如果真的需要进行调整的话,请提供像Brian Kernighan曾经说过的那样的使用语言中段的代码(译注:所谓语言中段的代码,即那些平台无关,不涉及可移植性的代码语法和元素)。库的可移植 性是一个更令人头疼的因素,不过C库也存在同样的问题。在C和C++中,编译器的标准遵守程度迥异,因此使用那些没有获得全面支持的新特性 (C99、C11以及C++11)将会是一个内在的风险。也就是说,C89可能是世界上最具可移植性的代码了。(为此,当可移植性成为最关心的事 情的时候,我们将选择它。例如,Lua团队就因此选择了C,当然也同样考虑到了性能因素)

应该说从性能、普遍性以及可移植性方面来讲,C仍然对C++保持着优势,但这种优势正在逐步缩小。在这点上,C++社区做得非常出色,他们让用户 去处理那些实质性问题并采纳。问题是:这些缩水的优势对C++的好处是种补偿吗?这些好处包括面向对象,异常处理,更好的类型管理,模板,更丰富 的标准库等等。没有了这些好处,每个用C实现的工程可能感觉起来就像尝试用一柄剪刀去修剪草坪。

那些特性无疑有助于代码编写,但却要因此付出代价 – 复杂性,这也是C有别于C++的重要之处。C是为数不多的几种规模短小、足够简洁的通用编程语言,你可以轻松掌握其全部内容。事实上我们确实可能需要 完整地了解一门语言的全部细节,并且还要充分了解其标准库,达到无需查看API手册即可使用的程度。我不相信这在其他主流语言中是可行的,C++,当然不行。

短小是语言的吸引力之一。你可以快速学习它并快速成为有效率的开发者。简洁则因另一个较少被谈及的特性而被提高:极致的语言可读性。我这里指的是 语义上而不是语法上的。在语义方面,C中做某件事情的方法是有限的。因此,当你阅读代码时,无论是谁编写的代码,你会确切地知道代码的行为。相反,C++ 做同一件事情有很多种方法 – C++开发者喜欢的一种灵活性。正是由于C在这方面的清晰,它才成为一门用于编写复杂基础设施的卓越编程语言。也正是这个原因,JRockit JVM(现在Oracle的主要JVM)的原始作者选择了C。在几年前的一段对话中,他们阐述了他们选择C而不是C++的观点:他们可以更快速获得开发 者;当深入到代码中时,他们可以比使用C++更容易地理解这些代码。

仅凭这一点,C语言仍然是系统层代码的一个极佳选择:它快速,可移植,易于阅读和理解。对于那些更加强调开发效率的应用,无疑C++将继续在原生语言中占据主导位置,并且很可能扩大其足迹。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言精进之路1 Go语言精进之路2 商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats