标签 工作 下的文章

也谈代码行统计

一直在纠结要不要就这个话题写点什么,之前梳理过一些思路,但感觉这个题目似乎没什么大意义。不过将东西憋在肚子里的滋味总是不好受的,最终我还是选择写出来一些,即便它真的没有什么意义^_^。

事情缘于近期领导让我负责的一个内部任务:制定组织内的代码行统计标准并实现标准化的工具。就是这个任务促使了我对代码行统计重新做了一番考量。

对代码行统计的理解

代码行统计这个活动不是软件开发过程中的关键路径活动,它对代码质量、开发进度以及软件价格几乎产生不了什么影响,应该算是个可有可无的东西。

就代码行统计这个活动本身而言,我个人的观点是没有代码行统计不表明不能开发出好软件;有了代码行统计,就一定能开发出高质量软件吗?

不过有一种观点认为:世界的本质是数据。通过数据我们可以发现事物运行的规律。代码行统计则是软件工程中对“数据”要求的产物。过程的好坏需要有数据支 撑,因此代码行统计这个活动成为了人们实现“用数据说话”的一柄利器。在“数据为王”的今天,我们无论如何都不能忽视数据的作用。人们通过数据来反映软件 开发过程中的一些规律性的东西本身也没有什么不妥。另外代码是软件开发过程的最重要成果物,因此围绕着代码的性态,我们用工具做诸多分析,期望从得到的数 据中找寻出一些可以指导和改善我们后续工作的蛛丝马迹。代码行统计提供的多是基础数据,在与其他过程基础数据结合分析后,我们能得到更多的信息。

合理地使用场合

个人觉得下面几个场合对代码行统计的需求是合理的:

* 统计代码总规模
   某个项目、某个模块或又某个版本的代码总规模。

* 代码“成分”统计
   统计空行、注释、代码的行数及占比、重复代码行数及占比等。

* 版本间代码变更差异统计
   两个有关联版本的数据对比统计,获取版本间的有效变更数据情况并作为基础数据提供给后续分析。

一些过程质量指标,诸如千行代码缺陷率等均是以上面这些代码行统计输出的基础数据为基础的。

“误用”

有合理的使用,就有“不合理”的使用 – “误用”。之所以加上引号,是因为至今人们对此见仁见智,尚无定论。以下列举两典型的“误用”。

* 通过代码行统计评估进度

有些组织在项目开始初期,就对成果的规模做了估计,比如10w行代码。然后在过程中使用代码统计工具对项目当前已实现的规模进行统计,并用统计出的数据与 初值的比值作为项目进度的评估参考。个人认为这是种典型的误用。盖茨说过:“用代码行数来衡量编程的进度,就如同用航空器零件的重量来衡量航空飞机的制造 进度一样”。且不提初期的估值有多么的不准确,就代码的行数本身而言,也受到各种因素的影响,比如设计方案、实现者的功力以及编码习惯等。同一个功能,A 实现需要100行代码;换成B就需要10行。

* 通过代码行统计评估程序员绩效

在一些外包公司或外包项目里,尤其是日本人的外包项目里,通过编写代码行的多少来评估程序员绩效的作法是很有市场的。我不能完全否定这种方法的正确性,因 为在日本外包项目中变态的日本人对代码的审核极其严格,并且有着苛刻的编码标准和风格,因此一些胡乱堆砌代码或使用奇技淫巧的代码都会被驳回,因此所有项 目开发者的效率似乎被约束到了一个平均线上。在这个前提下,产出的代码越多,似乎的确表明了这个开发者超出了平均效率,或至少牺牲了不少个人时间来完成项 目中的任务,精神可嘉,绩效被评高似乎也是合情合理的。但除此之外,用代码行多寡来评估程序员绩效显然是不受待见的。

考虑这个“误用”时,我也想模仿盖茨的话做个形象且深刻比喻,最初我写下的是这句话:“用代码行数多少来评估程序员的绩效,就好比用曲子的长短来评估音乐 家的水平,或又好比用画幅的大小来衡量画家的水准,或又好比用电影的时长 来掂量导演的功力!”。但仔细揣摩后发现这句话看起来挺像那么回事,但实际上却是不恰当的。什么是水准、水平或功力,这是衡量人的水平高低的;而绩效则是 一段时间范畴内工作成果的评估; 一个是长期的肯定,一个是阶段性的成绩。我显然是将水平和绩效(阶段性成绩)混为一谈了。高水平的开发者不一定每个周期都会取得高绩效,低水平的开发者也 不是无法取得高绩效的。因此这句话似乎应该改成:“用代码行数多少来评估程序员的绩效,就好比用这首曲子的长短来评估音乐家在这个阶段的水平,或又好比用 画幅的大小来衡量画家的这个阶段水准,或又 好比用电影的时长来掂量导演在这部电影上的功力!”。是不是读起来很别扭啊,反正我是这么觉得的。程序员的成果物是代码,代码好坏优劣对程序员绩效有着直 接影响(虽非充分必要条件),我们不妨替换一下本体来换种说法:“用代码行数多少来评估代码实现的好坏,就好比用曲子的长短来评估曲子的优劣,或又好比用 画幅的大小来衡量画作的高低,或又好比用电影的时长来掂量影片的良莠”!

对用代码行数多少来评估程序员绩效这种事情,我是很反感的,但在国内许多公司里,这种现象却又屡见不鲜。但这种行为背后的动机何在呢?传统工厂中,衡量一 个worker的绩效是相对容易量化,也比较客观的,比如制鞋厂可以用制成鞋子的数量来确定 worker绩效;在汽车组装车间,组装汽车的数量可以作为作为工人们的绩效;在炼钢厂,班组炼出的钢铁的吨数可作为班组成员绩效等等。将代码行数作为程 序员绩效的参考指标也许是一个无奈的方法。之所以想用代码行数,是因为程序员工作中能量化的东西不多,代码行数首当其冲。组织为了尽量减少绩效评定时主观 的成分,增加客观的评价,代码行统计从此被误用了。

代码行统计的高效使用

* 标准统一,工具一致

代码行统计工具有很多,因此执行这个活动时会出现不同人使用的代码行统计工具不一致的情况;并且不同工具对一些指标的定义也许有不同,这会导致收集到的数据存在含义不一致,精确度差的问题。因此高效使用代码行统计工具的一个前提就是(统计)标准统一,工具一致。

* 零干扰

一些传统的代码行统计方法是配置负责人收到统计任务时,将任务分发给各个模块的负责人,由各个模块负责人各自统计,然后反馈给配置负责人汇总。这种方式显 然不那么高效,而且容易引起一些对统计任务的反感情绪。高效的代码行统计最好能做到对开发人员“零干扰”。配置负责人可以通过“自动化”的静默方式收集代 码行数据。当然这需要对一些现成的开源工具做一些包装或二次开发才能做到,个人觉得这种投入是值得的,同时也能避免标准不一,工具不一致的情况。

buildc 0.3.1版本发布

随着buildc在内部应用的深入,buildc逐渐进入了以内部需求和问题为主要驱动力的演化模式。我们内部的C应用多是后端服务类应用,个人 觉得具有一定代表性。buildc最初就是为了针对这类C应用而设计的。因此我们内部的需求和问题应该也同样具有一定代表性,而这种演化模式在一 段时间范围内还是有意义的。

buildc 0.3.1版本修正了上一版本的若干bug,并增加了两个新功能。

* 提高容错能力

buildc对第三方库的组织结构有着严格的要求,一般是:

package_name/
      version/
         CPU_MODE_OS/
            include/
            lib/

一般来说,第三方库会由组织内特定人员进行管理和维护,第三方库服务器上的目录结构不会出现组织错误的情况。但buildc 0.3.0还是遇到特例了:当某个package的第三级目录为空时,buildc 0.3.0版本会抛出异常。为此,buildc 0.3.1增加了对这块逻辑的容错处理:
     1. 如果目录是空目录,直接略过。
     2. 如果目录存在合法的目录,cpu_mode_os,加入.buildc.repository中
     3. 如果目录中存在合法的目录和不合法的目录,略过不合法的目录。

* 支持命令行变量

有些项目针对不同客户有不同的功能版本,但代码是一份,针对不同客户的Release版本用一些特定的宏开关控制,而这些功能开关需要在编译构建 期指定。比如最初版本的buildc.cfg中的片段如下:

custom_defs = ['-std=gnu99', '-DLOGLEVEL=1', '-DUSE_NM']

后A省的客户希望LOGLEVEL用2级,不需要NM(网管)功能,而B省的客户希望LOGLEVEL用2级同时也使用NM功能,那我们的 custom_defs就需要有多种配置了,例如:

if province == "A":
    custom_defs = ['-std=gnu99', '-DLOGLEVEL=2']
elif provice == "B"
    custom_defs = ['-std=gnu99', '-DLOGLEVEL=2', '-DUSE_NM']
else:
    custom_defs = ['-std=gnu99', '-DLOGLEVEL=1', '-DUSE_NM']

province这个变量可以定义在buildc.cfg中,但每次针对不同省份Release时,需要手工修改province变量的值,这样 十分麻烦。因此我们想到是否可以让buildc像Make那样支持命令行变量呢,就像这样:

buildc config make province="B"

于是乎buildc 0.3.1版本就实现了这个功能,你可以在buildc config make或buildc pack中使用buildc的命令行变量,命令行变量支持var=value形式,其中value支持如下几种值:

var=1
var=on
var="on"

对于var=on,在buildc内部会将var=on转化为var="on",否则python会提示找不到on的定义。

* 支持指定项目配置文件(buildc.cfg)

当功能开关变得很多时,我们往往很难记住那么多命令行变量,我们可能就会为每个项目保存多个项目构建的配置文件,比如 buildc_for_liaoning.cfg、buildc_for_beijing.cfg等。而以前的buildc只默认支持 buildc.cfg这样一种配置文件,无法支持这类需求,因此buildc 0.3.1增加了指定项目配置文件功能。

如果你要为A省客户发布,你可以敲入buildc config make –config=PATH_OF_CONFIG_FILE,buildc就会加载你指定的配置文件了,而不是默认的buildc.cfg。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言精进之路1 Go语言精进之路2 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats