2005年八月月 发布的文章

APR源代码分析-设计篇

作为一个可移植的运行时环境,APR的设计当然是很精妙的,但精妙的同时对使用者有一些限制。

APR附带一个简短的设计文档,文字言简意赅,其中很多的设计思想都值得我们所借鉴,主要从三个方面谈。

1、类型
1) APR提供并建议用户使用APR自定义的数据类型,好处很多,比如便于代码移植,避免数据间进行不必要的类型转换(如果你不使用APR自定义的数据类型,你在使用某些APR提供的接口时,就需要进行一些参数的类型转换);自定义数据类型的名字更加具有自描述性,提高代码可读性。APR提供的基本自定义数据类型包括:
typedef unsigned char  apr_byte_t;
typedef short    apr_int16_t;
typedef unsigned short   apr_uint16_t;                                              
typedef int    apr_int32_t;
typedef unsigned int   apr_uint32_t;                                              
typedef long long   apr_int64_t;
typedef unsigned long long  apr_uint64_t;
这些都是在apr.h中定义的,而apr.h在UNIX平台是通过configure程序生成的,在不同平台APR自定义类型的实际类型是完全有可能不一致的。

2) 还有一点值得提的是在APR的设计文档中,它称“dso、mmap、process、thread”等为“base types”。很难用中文理解之,估计是指apr_mmap_t这些类型吧。权且这么理解吧^_^

3) 另外的一个特点就是大多APR类型中都包含一个apr_pool_t类型的字段,该字段用于分配APR内部使用的内存,任何APR函数需要内存都可以通过它分配。如果你创建一个新的类型,你最好在该类型中加入一个apr_pool_t类型的字段,否则所有操作该类型的APR函数都需要一个apr_pool_t类型的参数。

2、函数
1) 理解APR的函数设计对阅读APR代码很有帮助。看了APR代码你会发现很多类似APR_DECLARE(apr_hash_t *) apr_hash_make(apr_pool_t *pool)带APR_DECLARE宏的函数声明,到底是什么意思呢?为什么要加一个APR_DECLARE呢?在apr.h中有这样的解释:“APR的固定个数参数公共函数的声明形式APR_DECLARE(rettype) apr_func(args);而非固定个数参数的公共函数的声明形式为APR_DECLARE_NONSTD(rettype) apr_func(args, …);”。在Unix上的apr.h中有这两个宏的定义:
#define APR_DECLARE(type)            type
#define APR_DECLARE_NONSTD(type)     type
在apr.h文件中解释了这么做就是为了在不同平台上编译时使用“the most appropriate calling convention”,这里的“calling convention”是一术语,翻译过来叫“调用约定”。[注1]
常见的调用约定有:stdcall、cdecl、fastcall、thiscall和naked call,其中cdecl调用约定又称为C调用约定,是C语言缺省的调用约定。

2) 如果你想新增APR函数,APR建议你最好能按如下做,这样会和APR提供的函数保持最好的一致性:
 a) 输出参数为第一个参数;
 b) 如果某个函数需要内部分配内存,则将一个apr_pool_t参数放在最后。
 
3、错误处理
大型的系统程序的错误处理是十分重要的,APR作为一通用的库接口集合详细的说明了使用APR时如何进行错误处理。
1) 错误处理的第一步就是“错误码和状态码分类”。APR的函数大部分都返回apr_status_t类型的错误码,这是一个int型,在apr_errno.h中定义,和它在一起定义的还有apr所用的所有错误码和状态码。APR定义了5种错误码类型,它们分别为“0”[注2]、APR_OS_START_ERROR、APR_OS_START_STATUS、APR_OS_START_USEERR和APR_OS_START_SYSERR,它们每个都拥有自己独自的偏移量。

2) 如何定义错误捕捉策略?
由于APR是可移植的,这样就可能遇到这样一个问题:不同平台错误码的不一致。如何处理呢?APR给我们提供了2种策略:
a) 跨多平台返回相同的错误码
这种策略的缺点是转换费时且在转换时有错误码损耗。比如Windows操作系统定义了成百上千错误码,而POSIX才定义了50错误码,如果都转换为规范统一的错误码,势必会有错误码含义丢失,有可能得不到拥有真正含义的错误码。执行流程如:
make syscall that fails
        convert to common error code
        return common error code
——————————————————————-
            decide execution based on common error code

b) 返回平台相关错误码,如果需要将它转换为通用错误码
程序的执行路线往往要根据函数返回错误码来定,这么做的缺点就是把这些工作推给了程序员。执行流程如:
make syscall that fails
        return error code
——————————————————————-
            convert to common error code (using ap_canonical_error)
            decide execution based on common error code

[注1] 调用约定
我们知道函数调用是通过栈操作来完成的,在栈操作过程中需要函数的调用者和被调用者在下面的两个问题上做出协调,达成协议:
a) 当参数个数多于一个时,按照什么顺序把参数压入堆栈
b) 函数调用后,由谁来把堆栈恢复原来状态
在像C/C++这样的中、高级语言中,使用“调用约定”来说明这两个问题。

[注2] 特殊“0”
每个平台都有0,但是都没有实际的定义,0又的确是一个errno value的offset,但是它是“匿名的”,它不像EEXIST那样有着可以“自描述”的名字。

APR源代码分析-整体篇

由于部门所使用的底层库与Apache Server有着“一定的渊源”,所以总有一种想看看Apache的实现的冲动。最近项目收尾,愿望终可实现。

一、何为APR?
Apache Server经过这么多年的发展后,将一些通用的运行时接口封装起来提供给大家,这就是Apache Portable Run-time libraries, APR。

二、APR的目录组织
www.apache.org上下载apr-1.1.1.tar.gz到本地解压后,发现APR的目录结构很清晰。
1) 所有的头文件都放在$(APR)/include目录中;
2) 所有功能接口的实现都放在各自的独立目录下,如threadproc、mmap等;
3) 此外就是相关平台构建工具文件如Makefile.in等。曾经看过ACE的代码,ACE的所有源文件(.cpp)都放在一个目录下,显得很混乱。APR给我的第一印象还不错。
4) 进入各功能接口子目录,以threadproc为例,在其下面的子目录有5个,分别为beos、netware、os2、unix和win32。从APR的名字也可以理解,每个子目录下都存放着各个平台的独特实现源文件。

三、APR构建
如果想要使用APR,需要先在特定平台上构建它,这里不考虑多个平台的特性,仅针对Unix平台进行分析。
1) apr.h、apr.h.in、apr.h.hw和apr.h.hnw的关系
在$(APR)/include目录下,由于APR考虑移植性等原因,最基本的apr.h文件是在构建时自动生成的,其中apr.h.in类似一模板作为apr.h生成程序的输入源。其中apr.h.hw和apr.h.hnw分别是Windows和NetWare的特定版本。

2) 编译时注意事项
在Unix上编译时,注意$(APR)/build下*.sh文件的访问权限,应该先chmod一下,否则Make的时候会提示ERROR。

四、应用APR
我们首先make install一下,比如我们在Makefile中指定prefix=$(APR)/dist,则make install后,在$(APR)/dist下会发现4个子目录,分别为bin、lib、include和build,其中我们感兴趣的只有include和lib。下面是一个APR app的例子project。
该工程的目录组织如下:
$(apr_path)
 - dist
    – lib
    – include
 - examples
    – apr_app
      – Make.properties
      – Makefile
      – apr_app.c

我们的Make.properties文件内容如下:
#
# The APR app demo
#
CC              = gcc -Wall

BASEDIR         = $(HOME)/apr-1.1.1/examples/apr_app
APRDIR          = $(HOME)/apr-1.1.1
APRVER          = 1

APRINCL         = $(APRDIR)/dist/include/apr-$(APRVER)
APRLIB          = $(APRDIR)/dist/lib

DEFS            = -D_REENTRANT -D_POSIX_PTHREAD_SEMANTICS -D_DEBUG_
LIBS            = -L$(APRLIB) -lapr-$(APRVER) \
                  -lpthread -lxnet -lposix4 -ldl -lkstat -lnsl -lkvm -lz -lelf -lm -lsocket -ladm
INCL            = -I$(APRINCL)
CFLAGS          = $(DEFS) $(INCL)

Makefile文件内容如下:
include Make.properties

TARGET  = apr_app

OBJS    = apr_app.o

all: $(TARGET)

$(TARGET): $(OBJS)
        $(CC) ${CFLAGS} -o $@ $(OBJS) ${LIBS}
clean:
        rm -f core $(TARGET) $(OBJS)

而apr_app.c文件采用的是$(apr_path)/test目录下的proc_child.c文件。编译运行一切OK!

五、GO ON
分析APR的过程也是我学习Unix高级系统机制的过程,有时间我会继续APR分析的。

走马观花ANSI C标准-类型表示

类型表示(representation of types)

1、一般规则
a) 除了位域(bit field)之外的对象都是由一个或多个相邻序列字节组成的,这些字节的个数(number)、次序(order)和编码方式或是显式说明的,或是实现定义的。

b) 存储在非符号位域(unsigned bit field)和unsigned char类型对象中的值应该用纯二进制表示(pure binary notation)。(这里就可以理解为符号位当作普通二进制位看)

c) 存储在非位域的其他类型对象的值由n字节组成,这个值可以被拷贝到一个unsigned char[n]类型的对象中去。[注1]

2、整型
a) 对于无符号整型(而不是unsigned char),用于表示对象的位应分为两组:值位(value bits)和补充位(padding bits)。补充位的值是不确定的。

b) 对于有符号整型,用于表示对象的位应分为三组:值位(value bits)和补充位(padding bits)和符号位(sign bit)。这种类型应恰好有一位符号位,补充位不必要。

c) 整型的精度是指用来表示对象值所用的bit位数,不包括符号位和补充位。整型的宽度也是指用来表示对象值所用的bit位数,但它包含符号位。对于unsign整型来说其精度和宽度是相同的。

3、兼容类型(compatible type)和复合类型(composite type)
在平时的C语言使用中,我们几乎没提到过这两个概念,这里对这两个概念作简单解释:
兼容类型用来在不同翻译单元间检查类型兼容性;
复合类型产生的原因是由于这样的情况“在同一namespace和同一scope中,同一个标识符的声明不止一个”。

E.G.
void f();
void f(int p1[], const int p2, float * p3);
void f(int p1[2], int p2, float * p3);
Composite type is: void f(int p1[2], int p2, float *p3);

如果两个类型相同,则两个类型兼容。在这一规则背后隐藏着的含义是“兼容类型总是有着相同的表示(representation)和对齐(alignment)需求”。
关于兼容类型,标准中说了不少,不过觉得在使用时对之少有问津,所以到这就“浅尝辄止”了:)。

[注1]
也是由于这点,下面这个函数工作良好。
void dump_mem(const void *p, size_t size) {
        unsigned char *c = (unsigned char*)p;
        size_t i;

        YOUR_ASSERT(p != NULL);

        for (i = 0; i < size; i++) {
                printf("%02X ", c[i]);
        }

        printf("\t|");

        for (i = 0; i < size; i++) {
               if(isprint(c[i])) {
                    printf("%c ", c[i]);
               }
        }
        printf("\n");
}

用法:
int i = 0×45674142;
dump_mem(&i, sizeof(i));

输出:
42 41 67 45     |B A g E /* 在WinXP , MingW Gcc3.4.2 */
45 67 41 42     |E g A B /* 在Solaris, Gcc3.2 */




这里是Tony Bai的个人Blog,欢迎访问、订阅和留言!订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您喜欢通过微信App浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:



本站Powered by Digital Ocean VPS。

选择Digital Ocean VPS主机,即可获得10美元现金充值,可免费使用两个月哟!

著名主机提供商Linode 10$优惠码:linode10,在这里注册即可免费获得。

阿里云推荐码:1WFZ0V立享9折!

View Tony Bai's profile on LinkedIn


文章

评论

  • 正在加载...

分类

标签

归档











更多