线程函数参数引发的问题
上午我们的一个实施组从现网发回来一封邮件,接到这种邮件一般都是报告问题的,果然不出所料,现场出现一个core,经过分析这是个由于线程函数参数存储位置不当造成的,从中我们可以总结出一些经验,以避免以后再犯。
我采用下面的一个例子来模拟问题的出现:
#include <pthread.h>
#include <errno.h>
#include <stdio.h>
typedef struct foo {
char c[10];
int *p;
} foo;
void *thread_func(void *para) {
foo *p = (foo*)para;
sleep(5); //等待以让gen_thread先退出
printf("[thr2-1]: the foo’s str is %s\n", p->c);
printf("[thr2-1]: the foo’s p is %d\n", *(p->p));
*(p->p) = 10;
strcpy(p->c, "Bye, Tony");
printf("[thr2-2]: the foo’s str is %s\n", p->c);
printf("[thr2-2]: the foo’s p is %d\n", *(p->p));
return;
}
pthread_t gen_thread() {
pthread_t id;
int rv;
int i = 0;
foo f;
memset(&f, 0, sizeof(foo));
strcpy(f.c, "HelloTony");
f.p = &i;
printf("[thr1]: the foo’s str is %s\n", f.c);
printf("[thr1]: the foo’s p is %d\n", *(f.p));
rv = pthread_create(&id, NULL, (void*)thread_func, (void*)&f);
if (rv != 0) {
printf("create pthread error, errno is %d!\n", errno);
exit (1);
}
return id;
}
int main() {
pthread_join(gen_thread(), NULL);
return 0;
}
编译执行:
a.out
[thr1]: the foo’s str is HelloTony
[thr1]: the foo’s p is 0
[thr2-1]: the foo’s str is 旷
[thr2-1]: the foo’s p is 0
[thr2-2]: the foo’s str is Bye, Tony
[thr2-2]: the foo’s p is 10
段错误 ((主存储器)信息转储)
我们来分析一下出现core的过程,gen_thread函数在创建一个新的线程后退出,而在创建新的线程时,传给线程函数的参数是存储在gen_thread函数的栈上的局部变量。而在gen_thread退出后,新线程的线程函数对线程参数进行了修改,其结果就相当于修改了主线程的栈上的数据,而当系统调用访问主线程的栈数据时,这些数据已经被修改,导致系统调用访问到’非法地址’而Dump Core。
当然上面的例子是’臆造’出来的,这也是我们的系统在一个特殊情况下出现的问题,在以前的测试中从未发生。但是我们系统使用栈上变量作为线程函数参数,这确是一潜在的问题,尽管这种问题的发生几率很小。
那么如何解决这一问题呢?眼前就有两个办法:
1、使用全局变量或者是STATIC变量
在上面的例子中,如果我们把foo f拿到函数外,并声明为static foo f,那么Core就不会出现,因为STATIC变量存储在BSS段中,其Scope也是全局的(文件Scope的全局)。所以即使gen_thread返回,存储f的区域仍然是合法的。但是这样做的一个缺点就是:如果新创建多个线程的话,那么这些线程就会共享该参数了,这是一个需要考虑的问题,但是这种情况也许会是用于某些场合。
2、在堆上动态分配变量
在堆上分配变量,既可以避免使用局部变量的’非法访问’问题,也可以避免多个线程共享的问题,针对每创建一个新线程,我们都malloc一块内存,将这块内存地址作为参数传给线程函数。这样做也不是没有弊端,因为动态分配内存,所以你就需要自己管理内存,找到时机释放它。
还有一种方法叫’线程局部存储(Thread Local Storage,TLS)’,应该专门针对第一种办法的,针对声明为全局的或者STATIC的变量,给每个线程提供一份COPY,保证互不干扰。当然这种技术需要编译器的扩展支持,目前不常用,这里也就不多说了。
总之,通过对上面这个问题地分析,我们应该在使用线程的时候注意线程参数的存储方式,这才是我们讨论这个问题的目的。
评论