2010年二月月 发布的文章

HelloWorld.s

都说汇编不易学习和使用,的确不假。自己自大学以来也曾多次尝试学习汇编,甚至大学时还有相应课时,但是自己对汇编依旧是浅尝辄止。工作后也少有使用,对汇编的认识也就停留在基础层面。汇编的学习与对计算机系统的理解是密不可分的。工作这些年也算是一直浸淫于系统层面,经过多本底层相关书籍的教诲以及工作中的实践,对计算机系统的理解就自然而然加深了。昨天下载了一本名为:“Professional Assembly Language(中文名:汇编语言程序设计)” 的电子书,目的是想了解一下C内联汇编(Inline Assmebly)。花了半个小时读后,居然感觉轻松自如,和自己大脑中的知识融会贯通起来。发现这本书在卓越网还有“剩本”,也就抓紧买了下来,下周到货。

本书使用linux和AT&T汇编语法,正合我的胃口。以下是根据书中例子改出来的一段汇编版HelloWorld.s:

# HelloWorld.s
# as -o HelloWorld.o HelloWorld.s
# ld -o HelloWorld HelloWorld.o

.section .data
output:
        .ascii "hello world\n"

.section .text
.globl _start
_start:
        nop
        movl $output, %ecx
        movl $4, %eax   # the index of sys call 'write'
        movl $1, %ebx   # file descriptor
        movl $12, %edx  # length of the string
        int $0×80

        movl $1, %eax   # the index of sys call 'exit'
        movl $0, %ebx
        int $0×80

在调试上面代码时有两个注意事项要考虑:
1、调用write时,%edx务必赋值,否则将无法正确输出;
2、在Ubuntu 9.04下,如果结尾不调用exit,执行程序后会有'段错误',目前依然不得其解,通过GDB调测后猜测是未作收尾处理,处理器继续取EIP所指地址的指令内容,执行出错。

将这段代码拿到Solaris10 for x86上执行,无法输出“hello world”,并伴有'段错误',目前尚不得其解。

让HelloWorld.s作为再次尝试熟悉汇编的一个起点吧^_^。

也谈指针运算

指针在C语言中的位置这里就不多说了,这里说一下C的指针运算。指针运算一般针对的是同一连续内存块,不同内存块之间的指针运算无意义,甚至可能导致异常情况。

指针运算主要针对数组,常见的运算类型:+i, -i, ++, –以及 < , >等。

我们以+i操作为例。运算时编译器需要知道一些必要的信息,比如p = p + 1操作时编译器需要知道这个运算后,p这个指针需要移动多少个字节,那这个信息哪里来呢,由指针p所指数据单元的类型来确定。

比如:
int *p; [...] ; p = p + i => p指向int型数据,p加i运算后移动i * sizeof(int)个字节,即i * 4个字节。
char *p; [...] ; p = p + i => p指向char型数据,p加i运算后移动i * sizeof(char)个字节,即i * 1个字节。
struct Foo *p; [...] ; p = p + i => p指向struct Foo型数据,p加i运算后移动i * sizeof(struct Foo)个字节.
char *p[4](<=> (char*)p[4],可用char **p指向该数组中的某一个元素); [...] ; p = p + i => p指向char*数据,p加i运算后移动i * sizeof(char*)个字节,即i * 4个字节.
char (*p)[4](p是一个指向二维数组的指针,该二维数组的行宽度为char[4]); [...] ; p = p + i => p指向char[4]型数据,p加i运算后移动i * sizeof(char[4])个字节,即i * 4个字节。
int (*p)[7](p是一个指向二维数组的指针,该二维数组的行宽度为int[7]); [...] ; p = p + i => p指向int[7]型数据,p加i运算后移动i* sizeof(int[7])个字节,即i * 28个字节。

再考虑一个稍微复杂些的指针运算:有一个多维数组int a[5][6],一般取其中某个元素时可采用*(*(a + i) + j)的形式来达到目的。这个指针运算有些复杂,起码不那么一目了然,我们不妨用”代换法”来分析一下:

我们可将int a[5][6]理解为一个拥有5个元素,每个元素是int[6]类型的一维数组,其实若写成(int[6]) a[5]则更好理解(但可惜这不是C语言的语法),那么(int[6]) *p1则是指向数组(int[6]) a[5]中某个元素的指针,且可进行p1 = a这样的赋值;现在我们换成C语言语法那就是int (*p1)[6];p1 = a。这样一来我们将二维化为一维,就可以利用前面的规则了。a + i <=> p1 + i,指针移动 i * sizeof(int[6]);

我们让p2 = *(a + i) <=> *(p1 + i),这样p2同样也变成一维数组(int型一维数组),p2作为数组名,自然也可作指针操作;p2 + j后,指针再移动 sizeof(int) * j个字节。

综上,*(*(a + i) + j)运算后,指针实际移动了 i * sizeof(int[6]) + j * sizeof(int)个字节。

多维数组的指针运算必要信息是由除最左维度外其他所有维度的长度信息所共同组成的,比如一个三维数组:char a[5][6][7],匹配该数组的指针类型为char (*p)[6][7]; 二三维度的长度为编译器提供了指针运算的必要信息,这里也提醒我们在将多维数组作为参数传递时务必要小心参数匹配的问题,维度信息不同会导致多维数组与相应的函数形参匹配,比如:

char a[5][6][7]与void func(char a[][7][8]);因维度信息不同而无法匹配。
char a[5][6][7] or char (*p)[6][7]则与void func(char a[5][6][7])/void func(char (*p)[6][7])匹配。

命令行选项解析-备忘

翻看一本关于Shell方面的书,有一章节对命令行选项的讲解比较详细,这里总结了一下:

命令行选项分类:
1、无命令行选项(option)
如:mv file1 file2;
在命令后名显示增加一个'-',也是一种显式无option的表达。比如:mv – file1 file2

2、有命令行选项,但无Option参数
如:rm -f file1
rm -f -r dir1
无参数的option可组合在一起表达,如:rm -fr dir1

3、有命令行选项,且带命令行参数
如:gcc -o test test.c

4、长命令行选项(long options)
如:gcc –help

因为很少自己处理main(),所以似乎还从未写过解析复杂命令行选项的代码。复杂的命令行选项的解析还是蛮复杂的,但是不要自己发明轮子。GNU的标准库给我们提供了两个良好的接口getopt和getopt_long,而且在GNU C Manual中有很好的例子供参考。但getopt的那个例子是有bug的,某些情况cvalue值始终为NULL,会dump core(在Solaris下)。

初级文章,记之以备忘。




这里是Tony Bai的个人Blog,欢迎访问、订阅和留言!订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:


如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:


以太币:


如果您喜欢通过微信App浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:



本站Powered by Digital Ocean VPS。

选择Digital Ocean VPS主机,即可获得10美元现金充值,可免费使用两个月哟!

著名主机提供商Linode 10$优惠码:linode10,在这里注册即可免费获得。

阿里云推荐码:1WFZ0V立享9折!

View Tony Bai's profile on LinkedIn


文章

评论

  • 正在加载...

分类

标签

归档











更多