近期收到客户一个需求,我将该需求转述为下面这个等价的问题。

【问题】

    * 有一个产品包装系统S,为某种产品P提供产品包装服务;

    * 系统S由若干个处理节点组成,每个节点都可以单独处理组件;

    * 产品P的一个可出厂的成品由包装盒+N个产品组件组成,包装盒与产品组件上都贴有一个标签,该标签上包含该成品的唯一编号ID(一定时间范围内有效)、每个组件自己的序号(unit-num)以及成品的组件总个数(unit-total)。每个成品只有一个包装盒,该包装盒的组件序号为0。其中unit-num <= unit_total == N <= 32;

    * 某个成品的诸多组件是乱序到达S并由S送到产品包装工位的;当系统S第一次接收到一个成品的某个组件时,S会将一个包装盒贴上该组件对应的成品ID,并将其放在传送带上,传送给对应的组装工位;当系统S接收到同一成品的其他组件时,不再重新发放包装盒了;

    * 系统S具有剔除冗余组件的功能,如果某个成品的某个组件(序号为n)已经被S接收并送到指定包装位,后续若再出现同一成品的相同序号组件(可能是因为标签贴错导致),S将会将该冗余组件剔除出包装线;

    * 当某个成品的最后一个组件被S处理后,该成品的ID即告无效了,可以被后续成品重复使用了。

【解决思路】

这个问题中有几个关键功能点:

    * 每个成品只分配一个包装盒;

    * 支持剔重;

    * 当最后一个组件被处理后,成品ID被从系统中删除,可被后续成品重复使用。

这是一个典型的多个节点并发操作的一致性问题,我们初步考虑基于开源的MemcachedCAS服务去解决该问题,解决思路如下:

    a) S系统中的某个节点收到某成品的某个组件(unit_num = n)后,以ID为Key尝试获取成品的Value(以及item_cas值);如果索引尚未在系统建立,那么创建索引,以ID为Key,Value为一整型字符串,初值为1<<(n-1);并分配包装盒;

    b) 如果以成品ID为Key的索引已经建立,系统节点将组件的(1<<n)与Value进行“与操作”以判断该组件是否为重复组件,如果为1,则为重复组件;否则以(Value +  1 << (n-1))的值以及获得的item_cas发起cas操作;

    c) 如果cas操作成功,则数一下((Value +  1 << (n-1)) 中置位(=1)的bit个数,如果个数==unit-total,则删除索引;否则继续处理下一个组件;
        如果cas操作失败,则回到步骤a)。

【Demo代码】

/* pack_sys.c */

… …
#include <libmemcached/memcached.h>

static const char *product_id = "nexus5";
static const int component_in_total = 5;
static const int component_order[] = {2, 3, 1, 2, 5, 4};

//code from <Algorithms.for.Programmers.Ideas.and.Source.Code>
static inline unsigned long long
bit_count(unsigned long long x)
{
    x = (0x5555555555555555UL & x) + (0x5555555555555555UL & (x >> 1));
    x = (0x3333333333333333UL & x) + (0x3333333333333333UL & (x >> 2));
    x = (0x0f0f0f0f0f0f0f0fUL & x) + (0x0f0f0f0f0f0f0f0fUL & (x >> 4));
    x = (0x00ff00ff00ff00ffUL & x) + (0x00ff00ff00ff00ffUL & (x >> 8));
    x = (0x0000ffff0000ffffUL & x) + (0x0000ffff0000ffffUL & (x >> 16));
    x = (0x00000000ffffffffUL & x) + (0x00000000ffffffffUL & (x >> 32));
    return x;
}

int
main(int argc, char *argv[])
{
    memcached_st *memc;
    memcached_return_t rc = MEMCACHED_SUCCESS;
    memcached_server_st *server = NULL;

    memc = memcached_create(NULL);
    if (NULL == memc) {
        printf("memcached_create error\n");
        return -1;
    }

    … …

    rc = memcached_behavior_set(memc, MEMCACHED_BEHAVIOR_SUPPORT_CAS, 1);
    if (rc != MEMCACHED_SUCCESS) {
        printf("memcached_behavior_set support cas error: %s\n",
                memcached_strerror(memc, rc));
        return -1;
    }

    /* pack the component one by one */
    int ret = 0;
    int i = 0;
    for (i = 0; i < sizeof(component_order)/sizeof(component_order[0]); i++) {
        ret = pack_component(memc, component_order[i]);
        if (ret == 0) {
            printf("pack component [%d] ok\n”, component_order[i]);
        } else if (ret == 1) {
            printf("pack component [%d] exists\n”, component_order[i]);
        } else {
            printf("other error occurs\n");
            return -1;
        }
        getchar();
    }

    return 0;
}

int
pack_component(memcached_st *memc, int i)
{
    memcached_return_t rc = MEMCACHED_SUCCESS;

    uint32_t mask = 1 << (i – 1);
    uint32_t value_added = 1 << (i – 1);
    char value_added_str[11] = {0};
    uint32_t value = 0;
    char *pvalue = NULL;
    size_t value_len = 0;
    uint32_t flags = 0;

    while(1) {
        pvalue = memcached_get(memc, product_id, strlen(product_id),
                               &value_len, &flags, &rc);
        if (!pvalue) {
            if (rc == MEMCACHED_NOTFOUND) {
                printf("componet [%d] – memcached_get not found product key: [%s]\n",
                       i, product_id);
                memset(value_added_str, 0, sizeof(value_added_str));
                sprintf(value_added_str, "%u", value_added);
                rc = memcached_add(memc, product_id, strlen(product_id), value_added_str,
                                   strlen(value_added_str), 1000, 0);
                if (rc == MEMCACHED_DATA_EXISTS) {
                    printf("componet [%d] – memcached_add key[%s] exist\n", i, product_id);
                    pvalue = memcached_get(memc, product_id, strlen(product_id),
                                           &value_len, &flags, &rc);
                    if (!pvalue) return -1;
                } else if (rc != MEMCACHED_SUCCESS) {
                    printf("componet [%d] – memcached_add error: %s, [%d]\n",
                            i, memcached_strerror(memc, rc), rc);
                    return -1;
                } else {
                    printf("componet [%d] – memcached_add key[%s] successfully,"
                           " its value = %u, cas = %llu\n",
                            i,product_id,
                            value_added, (memc->result).item_cas);
                    return 0;
                }
            } else {
                printf("componet [%d] – memcached_get error: %s, %d\n",
                       i, memcached_strerror(memc, rc), rc);
                return -1;
            }
        }

        value = atoi(pvalue);
        printf("componet [%d] – memcached_get value = %u, cas = %llu\n",
                i, value, (memc->result).item_cas);

        if (value & mask) {
            free(pvalue);
            return 1;
        } else {
            uint64_t cas_value = 0;
            cas_value = (memc->result).item_cas;
            memset(value_added_str, 0, sizeof(value_added_str));
            sprintf(value_added_str, "%d", value_added + value);

            rc = memcached_cas(memc, product_id, strlen(product_id),
                               value_added_str, strlen(value_added_str),
                               1000, 0, cas_value);
            if (rc != MEMCACHED_SUCCESS) {
                printf("componet [%d] -  memcached_cas error = %d,  %s\n",
                        i, rc, memcached_strerror(memc, rc));
                free(pvalue);
            } else {
                printf("componet [%d] -  memcached_cas ok\n", i);
                free(pvalue);
                if (bit_count(value_added + value) == component_in_total) {
                    rc = memcached_delete(memc, product_id, strlen(product_id), 0);
                    if (rc != MEMCACHED_SUCCESS) {
                        printf("memcached_delete error: %s\n",
                                memcached_strerror(memc, rc));
                        return -1;
                    } else {
                        printf("memcached_delete key: %s ok\n", product_id);
                    }
                }
                return 0;

            }
        }
        getchar();
    }

    return 0;
}

代码看起来较多,主要是要考虑各种异常情况。

我们可以通过先后启动两个pack_sys来验证程序逻辑的正确性:

窗口1:
$> pack_sys
componet [2] – memcached_get not found product key: [nexus5]
componet [2] – memcached_add key[nexus5] successfully, its value = 2, cas = 0
pack component [2] ok

窗口2:
$> pack_sys
componet [2] – memcached_get value = 2, cas = 54
pack component [2] exists

若两个窗口继续交替执行,一种可能的结果如下:

窗口1:

$> pack_sys
componet [2] – memcached_get not found product key: [nexus5]
componet [2] – memcached_add key[nexus5] successfully, its value = 2, cas = 0
pack component [2] ok

componet [3] – memcached_get value = 2, cas = 54
componet [3] -  memcached_cas ok
pack component [3] ok

componet [1] – memcached_get value = 6, cas = 55
componet [1] -  memcached_cas ok
pack component [1] ok

componet [2] – memcached_get value = 23, cas = 57
pack component [2] exists

componet [5] – memcached_get not found product key: [nexus5]
componet [5] – memcached_add key[nexus5] successfully, its value = 16, cas = 0
pack component [5] ok

componet [4] – memcached_get value = 16, cas = 59
componet [4] -  memcached_cas ok
pack component [4] ok

窗口2:

$> pack_sys
componet [2] – memcached_get value = 2, cas = 54
pack component [2] exists

componet [3] – memcached_get value = 7, cas = 56
pack component [3] exists

componet [1] – memcached_get value = 7, cas = 56
pack component [1] exists

componet [2] – memcached_get value = 7, cas = 56
pack component [2] exists

componet [5] – memcached_get value = 7, cas = 56
componet [5] -  memcached_cas ok
pack component [5] ok

componet [4] – memcached_get value = 23, cas = 57
componet [4] -  memcached_cas ok
memcached_delete key: nexus5 ok
pack component [4] ok

全部Demo代码已经上传到github上了,感兴趣可以去下载。

【其它】

* 我用的是libmemcached 1.0.17版本,memcached 1.4.15版本。

* libmemcached启用cas后,只能在ascii模式下工作,在binary下会得到如下错误,应该是libmemcached的bug;

     memcached_cas error,  SERVER END, 21 

* libmemcached的官方文档中某些内容似乎已经落伍了,与代码的实际行为已经不一致了,参考manual的时候要小心,最好能对着源码看。

* 关于问题调试,可以考虑通过-vv命令行选项打开memcached的详细日志,这样你就可以看到memcached的一举一动,特别是涉及到binary protocol时,这样调试更有效率。