标签 线程 下的文章

线程函数参数引发的问题

上午我们的一个实施组从现网发回来一封邮件,接到这种邮件一般都是报告问题的,果然不出所料,现场出现一个core,经过分析这是个由于线程函数参数存储位置不当造成的,从中我们可以总结出一些经验,以避免以后再犯。

我采用下面的一个例子来模拟问题的出现:

#include <pthread.h>
#include <errno.h>
#include <stdio.h>

typedef struct foo {
        char c[10];
        int  *p;
} foo;

void *thread_func(void *para) {
        foo     *p      = (foo*)para;
        sleep(5); //等待以让gen_thread先退出
        printf("[thr2-1]: the foo’s str is %s\n", p->c);
        printf("[thr2-1]: the foo’s p is %d\n", *(p->p));
        *(p->p) = 10;
        strcpy(p->c, "Bye, Tony");
        printf("[thr2-2]: the foo’s str is %s\n", p->c);
        printf("[thr2-2]: the foo’s p is %d\n", *(p->p));
        return;
}

pthread_t gen_thread() {
        pthread_t       id;
        int             rv;
        int             i       = 0;
        foo             f;

        memset(&f, 0, sizeof(foo));
        strcpy(f.c, "HelloTony");
        f.p = &i;

        printf("[thr1]: the foo’s str is %s\n", f.c);
        printf("[thr1]: the foo’s p is %d\n", *(f.p));

        rv = pthread_create(&id, NULL, (void*)thread_func, (void*)&f);
        if (rv != 0) {
                printf("create pthread error, errno is %d!\n", errno);
                exit (1);
        }

        return id;
}

int main() {
        pthread_join(gen_thread(), NULL);
        return 0;
}

编译执行:
a.out
[thr1]: the foo’s str is HelloTony
[thr1]: the foo’s p is 0
[thr2-1]: the foo’s str is 旷
[thr2-1]: the foo’s p is 0
[thr2-2]: the foo’s str is Bye, Tony
[thr2-2]: the foo’s p is 10
段错误 ((主存储器)信息转储)

我们来分析一下出现core的过程,gen_thread函数在创建一个新的线程后退出,而在创建新的线程时,传给线程函数的参数是存储在gen_thread函数的栈上的局部变量。而在gen_thread退出后,新线程的线程函数对线程参数进行了修改,其结果就相当于修改了主线程的栈上的数据,而当系统调用访问主线程的栈数据时,这些数据已经被修改,导致系统调用访问到’非法地址’而Dump Core。

当然上面的例子是’臆造’出来的,这也是我们的系统在一个特殊情况下出现的问题,在以前的测试中从未发生。但是我们系统使用栈上变量作为线程函数参数,这确是一潜在的问题,尽管这种问题的发生几率很小。

那么如何解决这一问题呢?眼前就有两个办法:
1、使用全局变量或者是STATIC变量
在上面的例子中,如果我们把foo f拿到函数外,并声明为static foo f,那么Core就不会出现,因为STATIC变量存储在BSS段中,其Scope也是全局的(文件Scope的全局)。所以即使gen_thread返回,存储f的区域仍然是合法的。但是这样做的一个缺点就是:如果新创建多个线程的话,那么这些线程就会共享该参数了,这是一个需要考虑的问题,但是这种情况也许会是用于某些场合。

2、在堆上动态分配变量
在堆上分配变量,既可以避免使用局部变量的’非法访问’问题,也可以避免多个线程共享的问题,针对每创建一个新线程,我们都malloc一块内存,将这块内存地址作为参数传给线程函数。这样做也不是没有弊端,因为动态分配内存,所以你就需要自己管理内存,找到时机释放它。

还有一种方法叫’线程局部存储(Thread Local Storage,TLS)’,应该专门针对第一种办法的,针对声明为全局的或者STATIC的变量,给每个线程提供一份COPY,保证互不干扰。当然这种技术需要编译器的扩展支持,目前不常用,这里也就不多说了。

总之,通过对上面这个问题地分析,我们应该在使用线程的时候注意线程参数的存储方式,这才是我们讨论这个问题的目的。

APR分析-线程篇

并行一直是程序设计领域的难点,而线程是并行的一种重要的手段,而且线程的一些特性也能在进程并行时发挥很好的作用(在“线程同步篇”中详细阐述)。

APR线程的源代码的位置在$(APR_HOME)/threadproc目录下,本篇blog着重分析unix子目录下的thread.c文件内容,其相应头文件为$(APR_HOME)/include/apr_threadproc.h。

一、线程基础
深入理解计算机系统》(以下称CS.APP)一书中对线程基础概念的讲解让我眼前豁然开朗,这里不妨引述一下:
(1) 在传统观点中,进程是由存储于用户虚拟内存中的代码、数据和栈,以及由内核维护的“进程上下文”组成的,其中“进程上下文”又可以看成“程序上下文”和“内核上下文”组成,可参见下面图示:
进程–
      |- 进程上下文
             |- 程序上下文
                   |- 数据寄存器
                   |- 条件码
                   |- 栈指针
                   |- 程序计数器
            |- 内核上下文
                   |- 进程ID
                   |- VM结构
                   |- Open files
                   |- 已设置的信号处理函数
                   |- brk pointer
    |- 代码、数据和栈(在虚存中)
            |- 栈区 <– SP
            |- 共享库区
            |- 运行时堆区 <– brk
            |- 可读/写数据区
            |- 只读代码/数据区 <– PC

(2) 另种观点中,进程是由线程、代码和数据以及内核上下文组成的,下图更能直观的展示出两种观点的异同:
进程 –+
   |- 线程
           |- 栈区 <– SP
           |- 线程上下文
           |- 线程ID
           |- 数据寄存器
           |- 条件码
           |- 栈指针
           |- 程序计数器
  |- 内核上下文
           |- 进程ID
           |- VM结构
           |- Open files
           |- 已设置的信号处理函数
           |- brk pointer
  |- 代码、数据(在虚存中)
           |- 共享库区
           |- 运行时堆区 <– brk
           |- 可读/写数据区
           |- 只读代码/数据区 <– PC

对比两种观点我们可以得出以下几点结论:
(a) 从观点(2)可以看出进程内的多个线程共享进程的内核上下文和代码、数据(当然不包括栈区);
(b) 线程上下文比进程上下文小,且切换代价小;
(c) 线程不像进程那样有着“父-子”体系,同一个进程内的线程都是“对等的”,主线程与其他线程不同之处就在于其是进程创建的第一个线程。

二、APR线程管理接口
如今应用最广泛的线程包就是Posix Thread了。APR对线程的封装也是基于Posix thread的。

APR线程管理接口针对apr_thread_t这个基本的数据结构进行操作,apr_thread_t的定义很简单:
/* apr_arch_threadproc.h */
struct apr_thread_t {
    apr_pool_t *pool;
    pthread_t *td;
    void *data;
    apr_thread_start_t func;
    apr_status_t exitval;
};
这个结构中包含了线程ID、线程函数以及该函数的参数数据。不过APR的线程函数定义与Pthread的有不同,“Pthread线程函数”是这样的:
typedef void *(start_routine)(void*);
而“APR线程函数”如下:
typedef void *(APR_THREAD_FUNC *apr_thread_start_t)(apr_thread_t*, void*);

1、apr_thread_create
apr_thread_create内部定义了一个dummy_worker的“Pthread线程函数”,并将apr_thread_t结构作为参数传入,然后在dummy_worker中启动“APR的线程函数”。在该函数的参数列表中有一项类型为apr_threadattr_t:
struct apr_threadattr_t {
    apr_pool_t *pool;
    pthread_attr_t attr;
};
这个类型封装了线程的属性,不同的线程属性会导致线程的行为有所不同。Pthread提供多种线程属性设置接口,可是APR并未全部提供,必要时我觉得可以自己来调用Pthread接口。APR提供的属性设置接口包括设置线程的可分离性、线程栈大小和栈Guard区域属性。

2、apr_thread_exit
进程退出我们可以直接调用exit函数,而线程退出也有几种方式:
(1) 隐式退出 – 可以理解为线程main routine代码结束返回;
(2) 显式退出 – 调用线程包提供的显式退出接口,在apr中就是apr_thread_exit;
(3) 另类显式退出 – 调用exit函数,不仅自己退出,其所在线程也跟着退出了;
(4) 被“黑”退出 – 被别的“对等”线程调用pthread_cancel而被迫退出。
apr_thread_exit属于种类(2),该种类退出应该算是线程的优雅退出了。apr_thread_exit做了3个工作,分别为设置线程返回值、释放pool中资源和调用pthread_exit退出。

3、apr_thread_join和apr_thread_detach
进程有waitpid,线程有join。线程在调用apr_thread_exit后,只是其执行停止了,其占有的“资源”并不一定释放,这里的“资源”我想就是“另种观点”中的“线程上下文”,线程有两种方式来释放该“资源”,这主要由线程的“可分离”属性决定的。如果线程是“可分离的”,当线程退出后就会自动释放其“资源”,如果线程为“非可分离的”,则必须由“对等线程”调用join接口来释放其资源。apr_thread_detach用来将其调用线程转化为“可分离”线程,而apr_thread_join用来等待某个线程结束并释放其资源。

三、小结
基本的线程管理接口相对较简单,关键是对线程概念的理解。接下来的“线程同步”则是件比较有趣的话题。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言精进之路1 Go语言精进之路2 商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats