Apache - Tony Bai

标签 Apache 下的文章

APR源代码分析-内存篇

九月 7, 2005
3 条评论

内存管理一直是让C程序员头痛的问题，作为一个通用接口集，APR当然也提供其自己的内存管理接口–APR Pool。APR Pool作为整个APR的一个基础功能接口，直接影响着APR的设计风格。在这篇Blog中，我们就要和APR Pool来一次“亲密接触”。(还是以Unix平台实现为例)

APR Pool源代码的位置在$(APR_HOME)/memory目录下，本篇blog着重分析unix子目录下的apr_pools.c文件内容，其相应头文件为$(APR_HOME)/include/apr_pools.h；在apr_pools.c中还实现了负责APR内部内存分配的APR allocator的相关操作接口(APR allocator相关头文件为$(APR_HOME)/include/apr_allocator.h)。

一、APR Pool概述
我们平时常用的内存管理方式都是基于“request-style”的，即分配所请求大小的内存，使用之，销毁之。而APR Pool的设计初衷是为Complex Application提供良好的内存管理接口，其使用方式与“request-style”有所不同。在$(APR_HOME)/docs/pool-design.htm文档中，设计者道出了“使用好”APR Pool的几个Rules，同时也从侧面反映出APR Pool的设计。
1、任何Object都不应该有自己的Pool，它应该在其构造函数的调用者的Pool中分配。因为一般调用者知道该Object的生命周期，并通过Pool管理之。也就是说Object无须自己调用"Close" or "Free"，这些操作在Object所在Pool被摧毁时会被隐式调用的。
2、函数无须为了他们的行为而去Create/Destroy Pool，它们应该使用它们调用者传给它们的Pool。
3、为了防止内存无限制的增长，APR Pool建议当遇到unbounded iteration时使用sub_pool，标准格式如下：
subpool = apr_poll_create(pool, NULL);
for (i = 0; i < n; ++i) {
apr_pool_clear(subpool);
… …
do_operation(…, subpool);
}
apr_pool_destroy(subpool);

二、深入APR Pool
到目前为止我们已经知道了该如何“很好的”使用APR Pool，接下来我们来深入APR Pool的内部，看究竟有什么“奥秘”。
1、分析apr_pool_initialize
任何使用APR的应用程序一般都会调用apr_app_initalize来初始化APR的内部使用的数据结构，察看一下app_app_initialize的代码，你会发现apr_pool_initialize在被apr_app_initialize调用的apr_initialize中被调用，该函数用来初始化使用Pool所需的内部结构(用户无须直接调用apr_pool_initialize，在apr_app_initialize时它被自动调用，而apr_app_initialize又是APR program调用的第一个function，其在apr_general.h中声明，在misc/unix/start.c中实现)。

apr_pool_initialize的伪码如下（这里先不考虑多线程的情况）：
static apr_byte_t apr_pools_initialized = 0;
static apr_pool_t *global_pool = NULL;
static apr_allocator_t *global_allocator = NULL;

apr_pool_initialize
{
如果(!apr_pools_initialized)
{
创建global_allocator; ——(1)
}

创建global_pool; ——-(2)
给global_pool起名为"apr_global_pool";
}

(1) Pool和Allocator
每个Pool都有一个allocator相伴，这个allocator可能是Pool自己的，也可能是其Parent Pool的。allocator的结构如下：
/* in apr_pools.c */
struct apr_allocator_t {
    apr_uint32_t        max_index;
    apr_uint32_t        max_free_index;
    apr_uint32_t        current_free_index;
    … …[注1]
    apr_pool_t         *owner;
    apr_memnode_t      *free[MAX_INDEX];
};
在(1)调用后，global_allocator的所有xx_index字段都为0，owner–>NULL，free指针数组中的指针也都–>NULL。这里的index是大小的级别，这里最大级别为20(即MAX_INDEX = 20)，free指针数组中free[0]所指的node大小为MIN_ALLOC大小，即8192，即2的13次幂。按此类推free[19]所指的node大小应为2的32次幂，即4G byte。allocator_alloc中是通过index = (size >> BOUNDARY_INDEX) – 1来得到这一index的。allocator维护了一个index不同的memnode池，每一index级别上又有一个memnode list，以后用户调用apr_palloc分配size大小内存时，allocaotr_alloc函数就会在free memnode池中选和要寻找的size的index级别相同的memnode，而不是重新malloc一个size大小的memnode。另外要说明一点的是APR Pool中所有ADT中的xx_index字段都是大小级别的概念。

(2) 创建global_pool
在APR Pool初始化的时候，唯一创建一个Pool — global_pool。apr_pool_t的非Debug版本如下：
/* in apr_pools.c */
struct apr_pool_t {
    apr_pool_t           *parent;
    apr_pool_t           *child;
    apr_pool_t           *sibling;
    apr_pool_t           **ref;
    cleanup_t            *cleanups;
    cleanup_t            *free_cleanups;
    apr_allocator_t      *allocator;
    struct process_chain *subprocesses;
    apr_abortfunc_t       abort_fn;
    apr_hash_t           *user_data;
    const char           *tag;
    apr_memnode_t        *active;
    apr_memnode_t        *self; /* The node containing the pool itself */
    char                 *self_first_avail;
    … …
}
而apr_memnode_t的结构如下：
/* in apr_allocator.h */
struct apr_memnode_t {
    apr_memnode_t *next;            /**< next memnode */
    apr_memnode_t **ref;            /**< reference to self */
    apr_uint32_t   index;           /**< size */
    apr_uint32_t   free_index;      /**< how much free */
    char          *first_avail;     /**< pointer to first free memory */
    char          *endp;            /**< pointer to end of free memory */
};

apr_pool_create_ex首先通过allocator寻找合适的node用于创建Pool，但由于global_allocator尚未分配过任何node，所以global_allocator创建一个新的node，该node大小为MIN_ALLOC(即8192)，该node的当前状态如下：
node –>|—————|0
              |                      |
              |                     |
              |                     |
              |—————|APR_MEMNODE_T_SIZE first_avail
              |                      |
              |                     |
              |                      |
              —————– size(一般为8192) endp
其他属性值如下：
node->next = NULL;
node->index = (APR_UINT32_TRUNC_CAST)index; /* 这里为1 */

pool其他一些属性值(pool与pool之间关系)如下：
pool->allocator = global_allocator;
pool->child = NULL;
pool->sibling = NULL;
pool->ref = NULL;

也许现在你仍然不能看清楚APR Pool的结构，无需着急，我们继续往下分析。

2、APR Sub_Pool创建(pool与pool之间关系)
上面我们已经初始化了global_pool，但是global_pool是不能直接拿来就用的，我们需要创建其sub_pool，也就是用户自己的pool。一般创建user的sub_pool我们都使用apr_pool_create宏，它只需要2个参数，并默认sub_pool继承parent_pool的allocator和abort_fn。在apr_pool_create内部调用的还是apr_pool_create_ex函数。我们来看一下创建sub_pool后pool之间的关系：
例:
static apr_pool_t *sub_pool = NULL;
apr_pool_create(&sub_pool, NULL);

这里sub_pool的创建过程与global_pool相似，也是先创建其承载体node，然后设置相关属性，使其成为global_pool的child_pool。创建完后global_pool和该sub_pool的关系如下图：
global_pool    sub_pool
———–             \ /          ————
sibling —>NULL    /——-   parent
———–             /             ————
child ———— /                 sibling —–>NULL
———–                            ————
                                             child ——>NULL
                                            ————
APR Pool是按照二叉树结构组织的，并采用“child-sibling”的链式存储方式，global_pool作为整个树的Root Node。如果APR Pool中存在多个Pool，其节点结构关系如下：
               /-child–>
              / ——–Pool_level1-a
             / / parent   /|\    |
            /|/_              |     | sibling
global_pool             |     |
            \                  |    \|/
             \-child-> Pool_level1-b
            /|\                  |
             -parent——

3、从pool中分配内存
上面我们已经拥有了一个sub_pool，我们现在就可以从sub_pool中分配内存了。APR提供了函数apr_palloc来做这件事情。
例如：apr_alloc(sub_pool, wanted_mem_size);
apr_palloc在真正分配内存前会把wanted_mem_size做一下处理。它使用APR_ALIGN_DEFAULT宏处理wanted_mem_size得到一个圆整到8的new_size，然后再在pool中分配new_size大小的内存，也就是说pool中存在的用户内存块的大小都是8的倍数。举个例子来说，如果wanted_mem_size = 30，apr_alloc实际会在pool中划分出32个字节的空间。

apr_palloc的工作流程简单描述是这样的：
a) 如果在pool->active node的avail space足够满足要申请的内存大小size时，则直接返回active->first_avail，并调整active->first_avail = active->first_avail + size；
b) 如果a)不满足，则察看active->next这个node满足与否；如果满足则将返回所要内存，并将该node设为active node，将以前的active node放在新active node的next位置上;
c) 如果b)也不满足，则新创建一个memnode，这个node可能为新创建的，也可能是从allocator的free memnode池中取出的，取决于当时整个Pool的状态。

从上面我们也可以看出node分为2类，一种是作为pool的承载体，但pool结构的空间不足以完全占满一个node，所以也可以用来分配用户内存；另一种就是完全用于分配用户内存的了。每个pool有一个node list，当然这个list中包括它自己所在的node了。

4、apr_pool_clear和apr_pool_destroy
创建和分配结束后，我们需要clear或者destroy掉Pool。
clear和destroy的区别在于clear并不真正free内存，只是清理便于以后alloc时重用，而destroy则是真正的free掉内存了。

三、总结
本文并未说明APR Pool有哪些优点或缺点(除了概述中的一些Rules)，仅是把其来龙去脉弄清。

[注1]
在本文中出现的"… …"的符号表示与多线程相关的字段和代码的省略。

APR源代码分析-进程篇

九月 1, 2005
0 条评论

Apache Server的进程调度一直为人所称道，Apache 2.0推出的APR对进程进行了封装，特别是Apache 2.0的MPM(Multiple Process Management)框架就是以APR封装的进程为基础的，下面就让我们一起来探索一下APR的进程封装吧(以Unix平台为例)。

APR进程封装源代码的位置在$(APR_HOME)/threadproc目录下，本篇blog着重分析unix子目录下的proc.c文件内容，其相应头文件为$(APR_HOME)/include/apr_thread_proc.h。

一、APR进程概述
APR进程封装采用了传统的fork-exec配合方式(spawn)，即父进程在fork出子进程后继续执行其自己的代码，而子进程调用exec函数加载新的程序映像到其地址空间，执行新的程序。我们先来看看使用APR创建一个新的进程的流程，然后再根据流程做细节分析：
apr_proc_t newproc;
apr_pool_t *p;

apr_status_t rv;
const char *args[2];
apr_procattr_t *attr;

/* 初始化APR内部使用的内存 */
rv = apr_pool_initialize();
HANDLE_RTVAL(apr_pool_initialize, rv);[注1]

rv = apr_pool_create(&p, NULL);
HANDLE_RTVAL(apr_pool_create, rv);

/* 创建并初始化新进程的属性 */
rv = apr_procattr_create(&attr, p);
HANDLE_RTVAL(apr_procattr_create, rv);

rv = apr_procattr_io_set(attr, APR_FULL_BLOCK, APR_FULL_BLOCK,
APR_NO_PIPE); /* 可选 */
HANDLE_RTVAL(apr_procattr_io_set, rv);

rv = apr_procattr_dir_set(attr, "startup_path"); /* 可选 */
HANDLE_RTVAL(apr_procattr_dir_set, rv);

rv = apr_procattr_cmdtype_set(attr, APR_PROGRAM); /* 可选 */
HANDLE_RTVAL(apr_procattr_cmdtype_set, rv);

… … /* 其他设置进程属性的函数 */

/* 创建新进程 */
args[0] = "proc_child";
args[1] = NULL;
rv = apr_proc_create(&newproc, "your_progname", args, NULL, attr, p);
HANDLE_RTVAL(apr_proc_create, rv);

/* 等待子进程结束 */
rv = apr_proc_wait(&newproc, NULL, NULL, APR_WAIT);
HANDLE_RTVAL(apr_proc_wait, rv);

二、APR procattr创建
在我们平时的Unix进程相关编程时，我们大致会接触两类进程操作函数：进程创建函数(如fork和exec等)和进程属性操作函数(getpid、chdir等)，APR将进程的相关属性信息封装到apr_procattr_t结构体中，我们来看看这个重要的结构体定义：(这里只列出Unix下可用的属性)

/* in $(APR_HOME)/include/arch/unix/apr_arch_threadproc.h */
struct apr_procattr_t {
/* PART 1 */
apr_pool_t *pool;

    /* PART 2 */
    apr_file_t *parent_in;
    apr_file_t *child_in;
    apr_file_t *parent_out;
    apr_file_t *child_out;
    apr_file_t *parent_err;
    apr_file_t *child_err;

    /* PART 3 */
    char *currdir;
    apr_int32_t cmdtype;
    apr_int32_t detached;

    /* PART 4 */
    struct rlimit *limit_cpu;
    struct rlimit *limit_mem;
    struct rlimit *limit_nproc;
    struct rlimit *limit_nofile;

    /* PART 5 */
    apr_child_errfn_t *errfn;
    apr_int32_t errchk;

    /* PART 6 */
    apr_uid_t   uid;
    apr_gid_t   gid;
};
我这里将apr_procattr_t包含的字段大致分为6部分，下面逐一说明：
[PART 1]
在上一篇关于APR的blog中说过，大部分的APR类型中都会有一个apr_pool_t类型字段，用于APR内部的内存管理，此结构也无例外。该字段用来标识procattr在哪个pool中分配的内存。

[PART 2]
进程不是孤立存在的，进程也是有父有子的。父子进程间通过传统的匿名pipe进行通信。在apr_procattr_io_set(attr, APR_FULL_BLOCK, APR_FULL_BLOCK, APR_FULL_BLOCK)调用后，我们可以用下面的图来表示这些字段的状态：[注3]

parent_in ———————————————-
                                                                       \|/
                     ——————————————
                     filedes[0]     “in_pipe”       filedes[1]
                     ——————————————
                    /|\
child_in ——

parent_out —-
                     \|/
                     ——————————————-
                     filedes[0]     “out_pipe”       filedes[1]
                     ——————————————-
                                                                          /|\
child_out ———————————————-

parent_err —-
                     \|/
                     ——————————————-
                     filedes[0]     “err_pipe”       filedes[1]
                     ——————————————-
                                                                        /|\
child_err ————————————————

还有一点值得注意的是apr_procattr_io_set调用apr_file_pipe_create创建pipe的时候，为相应的in/out字段注册了cleanup函数apr_unix_file_cleanup，apr_unix_file_cleanup在相应的in/out字段的pool销毁时被调用，在后面的apr_proc_create时还会涉及到这块儿。

[PART 3]
进程的一些常规属性。
currdir标识新进程启动时的工作路径(执行路径)，默认时为和父进程相同；
cmdtype标识新的子进程将执行什么类型的命令；共5种类型，默认为APR_PROGRAM，定义见[注2]
detached标识新进程是否为分离后台进程，默认为前台进程。

[PART 4]
这4个字段标识平台对进程资源的限制，一般我们接触不到。struct rlimit的定义在/usr/include/sys/resource.h中。

[PART 5]
errfn为一函数指针，原型为typedef void (apr_child_errfn_t)(apr_pool_t *proc, apr_status_t err, const char *description); 这个函数指针如果被赋值，那么当子进程遇到错误退出前将调用该函数。
errchk一个标志值，用于告知apr_proc_create是否对子进程属性进行检查，如检查curdir的access属性等。

[PART 6]
用户ID和组ID，用于检索允许该用户所使用的权限。

三、APR proc创建
APR proc的描述结构为apr_proc_t：
typedef struct apr_proc_t {
    /** The process ID */
    pid_t pid;
    /** Parent's side of pipe to child's stdin */
    apr_file_t *in;
    /** Parent's side of pipe to child's stdout */
    apr_file_t *out;
    /** Parent's side of pipe to child's stdouterr */
    apr_file_t *err;
} apr_proc_t;
结构中有很清晰明了的注释，这里就不再说了。
创建一个新的进程的接口为apr_proc_create，其参数也都很简单。前面说过apr_proc_create先fork出一个子进程，众所周知fork后子进程是父进程的复制品[注4]，然后子进程再通过exec函数加载新的程序映像，并开始执行新的程序。这里分析一下apr_proc_create的执行流程，其伪码如下：
apr_proc_create
{
   if (attr->errchk)
      对attr做有效性检查，让错误尽量发生在parent process中，而不是留给child process; —-(1)

fork子进程;

   { /* 在子进程中 */
      清理一些不必要的从父进程继承下来的描述符等，为
      exec提供一个“干净的”环境；——(2)

      关闭attr->parent_in、parent_out和parent_err，
      并分别重定向attr->child_in、child_out和child_err为
      STDIN_FILENO、STDOUT_FILENO和STDERR_FILENO; —–(3)

判断attr->cmdtype，选择执行exec函数; ——(4)
}

/* 在父进程中 */
关闭attr->child_in、child_out和child_err;
}

下面针对上述伪码进行具体分析：
(1) 有效性检查
attr->errchk属性可以通过apr_procattr_error_check_set函数在apr_proc_create之前设置。一旦设置，apr_proc_create就会在fork子进程前对procattr的有效性进行检查，比如attr->curdir的访问属性(利用access检查)、progname文件的访问权限检查等。这些的目的就是一个：“让错误发生在fork前，不要等到在子进程中出错”。

(2) 清理“不必要的”继承物
由于子进程复制了父进程的地址空间，随之而来的还包含一些“不必要”的“垃圾”。为了给exec提供一个“干净的”环境，在exec之前首先要做一下必要的清理，APR使用apr_pool_cleanup_for_exec来完成这项任务。apr_pool_cleanup_for_exec究竟做了些什么呢？这涉及到了apr_pool的设计，这里仅仅作简单说明。apr_pool_cleanup_for_exec通过pool内部的global_pool搜索其子结点，并逐一递归cleanup，这里的cleanup并不释放任何内存，也不flush I/O Buffer，仅是调用结点注册的相关cleanup函数，这里我们可以回顾一下apr_procattr_io_set调用，在创建相关pipe时就为相应的in/out/err描述符注册了cleanup函数。同样就是因为这点，子进程在调用apr_pool_cleanup_for_exec之前，首先要kill掉（这里理解就是去掉相关文件描述符上的cleanup注册函数）这些注册函数。防止相关pipe的描述符被意外关闭。

(3) 建立起与父进程“对话通道”
父进程在创建procattr时就建立了若干个pipe，fork后子进程继承了这些。为了关掉一些不必要的描述符和更好的和父进程通讯，子进程作了一些重定向的工作，这里用2副图来表示重定向前后的差别：（图中显示的是子进程关闭parent_in/out/err三个描述符后的文件描述表）

重定向前：

重定向后：

(4) 启动新的程序
根据APR proc的设计，子进程在被fork出来后，将根据procattr的cmdtype等属性信息决定调用哪种exec函数。当子进程调用一种exec函数时，子进程将完全由新程序代换，而新程序则从其main函数开始执行(与fork不同，fork返回后子进程从fork点开始往下执行)。因为调用exec并不创建新进程，所以前后的进程ID并未改变。exec只是用另一个新程序替换了当前进程的正文、数据、堆和栈段。这里不详述这几种函数的差别，在参考资料中有相关描述[注5]。

四、总结
简单分析了一下APR的进程封装，APR的源代码注释很详尽，很多细节可以直接察看源码。

[注1]
#define HANDLE_RTVAL(func, rv) do { \
if (rv != APR_SUCCESS) { \
printf("%s executes error!\n", #func); \
return rv; \
} \
} while(0)

[注2]
typedef enum {
    APR_SHELLCMD,           /* use the shell to invoke the program */
    APR_PROGRAM,            /* invoke the program directly, no copied env */
    APR_PROGRAM_ENV,        /* invoke the program, replicating our environment */
    APR_PROGRAM_PATH,       /* find program on PATH, use our environment */
    APR_SHELLCMD_ENV        /* use the shell to invoke the program, replicating our environment */
} apr_cmdtype_e;

[注3]
xx_in/xx_out都是相对于child process来说的，xx_in表示通过该描述符child process从in_pipe读出parent process写入in_pipe的数据；xx_out表示通过该描述符child process将数据写入out_pipe供parent process使用；xx_err则是child process将错误信息写入err_pipe供parent process使用。

[注4]
fork后子进程和父进程的同和异
同：
子进程从父进程那继承了
– 父进程已打开的文件描述符；
– 实际用户ID、实际组ID、有效用户ID、有效组ID；
– 添加组ID；
– 进程组ID；
– 对话期ID；
– 控制终端；
– 设置用户ID标志和设置组ID标志；
– 当前工作目录；
– 根目录；
– 文件方式创建屏蔽字；
– 信号屏蔽和排列；
– 对任一打开文件描述符的在执行时关闭标志；
– 环境；
– 连接的共享存储段；
– 资源限制。

异：
– fork的返回值；
– 进程ID；
– 不同的父进程ID；
– 子进程的tms_utime, tms_stime, tms_cutime以及tme_ustime设置为0；
– 父进程设置的锁，子进程不继承；
– 子进程的未决告警被清除；
– 子进程的未决信号集设置为空集。

[注5]
这里引用《Unix环境高级编程》中关于如何区分和记忆exec函数族的方法：“这六个exec函数的参数很难记忆。函数名中的字符会给我们一些帮助。字母p表示该函数取filename作为参数，并且用PATH环境变量寻找可执行文件。字母l表示该函数取一个参数列表，它与字母v互斥。v表示该函数取一个argv[]。最后，字母e表示该函数取envp[] 数组，而不使用当前环境。”

参考资料：
1、《Unix环境高级编程》
2、《Unix系统编程》