标签 编程 下的文章

2023年的Rust与Go[译]

本文永久链接 – https://tonybai.com/2023/02/22/rust-vs-go-in-2023

本文译自《Rust vs Go in 2023》

注:从2022年下半年开始,我们研发团队的产品研发不再局限于云端,车端也是将来的一个重要方向。于是我除了继续对Go语言保持常规的高度关注之外,也逐步开始留意Rust语言的发展。


Rust和Go哪个更好?Go还是Rust?在2023年,你应该为你的下一个项目选择哪种语言,为什么?两者在性能、简单性、安全性、功能、规模和并发性等方面如何比较?它们的共同点是什么,它们有哪些根本性的不同?让我们在这个友好而公平的Rust和Go的比较中找到答案。

Rust和Go都很棒

首先,我必须要说的是,Go和Rust都是绝对优秀的编程语言。它们都是现代的、强大的、被广泛采用的编程语言,并且都提供出色的性能。

你可能读过一些说Go比Rust好的文章,或者相反。但这真的没有意义;每一种编程语言都代表了一系列的权衡和取舍。每种语言都有自己的优化重点,所以你对语言的选择应该由适合你的东西和你想用它解决的问题决定。

在这篇文章中,我将尝试告诉你何时使用Go是理想选择以及何时使用Rust更佳。我也会试着介绍一下这两种语言的本质(如果你愿意的话,就是Go和Rust的道)。

虽然它们在语法和风格上有很大不同,但Rust和Go都是构建软件的一流工具。接下来,让我们仔细看看这两种语言。

Go和Rust的相似之处

Rust和Go有很多共同点,这也是你经常听到它们一起被提及的原因之一。两种语言的共同目标是什么呢?

Rust是一种低级静态类型的多范式编程语言,专注于安全和性能。 – Gints Dreimanis

Go是一种开源的编程语言,可以轻松构建简单、可靠、高效的软件。 – go.dev

内存安全

Go和Rust都属于现代编程语言,它们的首要任务是内存安全。经过几十年对C和C++等旧语言的使用,我们可以清楚地看到,导致错误和安全漏洞的最大原因之一是不安全地或不正确地访问内存。

Rust和Go以不同的方式处理这个问题,但它们的目标都是在管理内存方面比其他语言更聪明、更安全,并帮助你写出正确高性能的程序。

快速、紧凑的可执行文件

Go和Rust都是编译型语言,这意味着你的程序被直接翻译成可执行的机器码,因此你可以以单一二进制文件形式来部署你的程序;与Python和Ruby等解释型语言不同,你不需要将解释器和大量的库和依赖关系与你的程序一起分发,这是一个很大的优点。这也使得Rust和Go的程序与解释型语言相比都非常快。

通用语言

Rust和Go都是强大的、可扩展的通用编程语言,你可以用它们来开发各种现代软件,从网络应用到分布式微服务,或者从嵌入式微控制器到移动应用程序。

两者都有优秀的标准库、繁荣的第三方生态系统以及巨大的商业支持和庞大的用户基础。它们都已经存在了很多年,并将在未来几年内继续被广泛使用。今天学习Go或Rust将是对你时间和精力的合理投资。

务实的编程风格

Go和Rust都不是以函数式编程为主的语言(例如像Scala或Elixir),也不是完全面向对象的语言(像Java和C#)。相反,虽然Go和Rust都有与函数式和面向对象编程相关的特性,但它们是务实的语言,旨在以最合适的方式解决问题,而不是强迫你采用特定的做事方式。

如果你喜欢函数式编程风格,你会在Rust中发现更多对这种风格的支持,因为Rust在语法特性数量上要比Go更多。

我们可以讨论什么是“面向对象”语言,但可以说C++、Java或C#用户所期望的面向对象编程风格在Go或Rust中都不存在。 – Jack Mott

规模化的开发

Rust和Go都有一些有用的特性,使它们适合于大规模的编程,不管是指大型团队,还是大型代码库,或者两者兼具。

例如,C语言的程序员们多年来一直在争论将括号放在哪里,以及代码应该用制表符还是空格缩进,而Rust和Go通过使用标准的格式化工具(Go为gofmt,Rust为rustfmt)使用规范的风格自动重写你的代码,完全消除了这些问题。

这并不是说这种特殊的风格本身有多好:而是Rust和Go的程序员都喜欢这种标准化

gofmt的风格是没有人喜欢的,但gofmt却是所有人的最爱。 – Rob Pike

两种语言的另一个高分领域是构建管道(pipeline)。两种语言都有优秀的、内置的、高性能的标准构建和依赖管理工具;不再需要与复杂的第三方构建系统搏斗,也不再需要每隔几年就学习一个新的系统。

对于早期职业生涯以Java和Ruby为背景的我而言,构建Go和Rust代码感觉就像从我的肩上卸下了一个不可能的重担。当我在谷歌工作时,遇到用Go编写的服务是一种解脱,因为我知道它很容易构建和运行。Rust也是如此,尽管我只在较小规模的Rust项目上工作过。我希望可无限配置的构建系统的时代已经过去了,所有语言都会有自己专门的构建工具,开箱即可使用。- 山姆-罗斯

Rust还是Go?

综上可知,这两种语言都设计得很好、很强大,那么你可能会想知道那些关于两门语言的“圣战”究竟是怎么回事(我也是)。为什么人们对“Go vs.Rust”如此大惊小怪,在社交媒体上大打出手,并且写长篇博文说只有傻瓜才会使用Rust,或者Go不是真正的编程语言,或者其他什么。

这可能会让他们感觉好些,但这并不能完全帮助你,因为你正试图决定在你的项目中使用哪种语言,或者你应该学习哪种语言来推动你的编程生涯。一个明智的人不会根据谁喊得声最大来做出重要的选择。

现在让我们继续我们成熟的讨论,看看在某些领域,一个有理智的人可能更喜欢哪一种语言。

Go与Rust的性能对比

我们已经说过,Go和Rust都能生产出高性能的程序,因为它们被编译成了本地机器代码,而不必通过解释器或虚拟机。

然而,Rust的性能尤其突出。它可以与C和C++相媲美,这两种语言通常被认为是性能最高的编译语言,但与这些老语言不同的是,Rust还提供了内存安全和并发安全,并且基本上不会给执行速度上带去没有任何开销。Rust还允许你创建复杂的抽象,而不需要在运行时付出任何性能上的代价。

相比之下,尽管Go程序的性能也非常好,但Go主要是为开发速度(包括编译)而设计的,而不是执行速度。Go程序员更倾向于清晰的代码而不是快速的代码

Go编译器也不会花很多时间去尝试生成最有效的机器代码;它更关心的是快速编译大量代码。所以Rust通常会在运行时基准测试中击败Go。

Rust的运行时性能也是一致和可预测的,因为它不使用垃圾收集。Go的垃圾收集器非常高效,并且经过优化,使其“STW(停止世界)”的停顿时间尽可能短(每一个新的Go版本都会越来越短)。但是垃圾收集不可避免地在程序的行为方式中引入了一些不可预测的因素,这在某些应用中可能是一个严重的问题,例如嵌入式系统。

因为Rust旨在让程序员完全控制底层硬件,所以有可能将Rust程序优化到相当接近机器的最大理论性能。这使得Rust在执行速度胜过所有其他考虑因素的领域是一个很好的选择,比如游戏编程、操作系统内核、网络浏览器组件和实时控制系统。

简单性

如果没有人能够弄清楚如何使用一种编程语言,那么这种语言有多快也无所谓。Go语言是为了应对C++等语言不断增长的复杂性而特意设计的;它的语法非常少,关键字也非常少,事实上,功能特性也很少。

这意味着学习Go语言不需要很长时间,就可以用它来编写有用的程序。

Go是非常容易学习的。我知道这是一个经常被吹捧的好处,但我真的很惊讶于我能够如此迅速地提高工作效率。多亏了这个语言、文档和工具,我在两天后就写出了有趣的、可提交的代码。 – 一个Rust程序员对Go的早期印象

这里的关键词是简单性。当然,简单并不等同于容易,但是小而简单的语言比大而复杂的语言更容易学习。Go语言没有提供那么多不同的方法来做一件事情,所以所有写得好的Go代码往往看起来都一样。快速学习一个不熟悉的服务并理解它在做什么很容易。

fmt.Println("Gopher's Diner Breakfast Menu")
for dish, price := range menu {
    fmt.Println(dish, price)
}

在我的代码俱乐部视频系列中,我正是这样做的:从GitHub上半随机地挑选Go项目,并与一群Go初学者一起探索它们,看看我们能理解多少的代码。结果总是比我们预期的要多。

虽然核心语言很小,但Go的标准库却非常强大。这意味着你的学习曲线也需要包括你需要的标准库的部分,而不仅仅是Go语法。

另一方面,将功能从语言中转移到标准库中,意味着你可以只专注于学习与你现在相关的库。

Go也是为大规模的软件开发而设计的,支持有大型代码库的大型团队。在这种情况下,新的开发人员能够尽快上手是非常重要的。出于这个原因,Go社区十分看重:简单、明显、常规、直接的程序

使用Go,你可以快速完成工作。Go是我所使用过的生产力最高的语言之一。它的口号是:今天解决实际问题。 – 马蒂亚斯-恩德勒

特性

Rust比其他几种编程语言支持更多的复杂语法特性,因此,你可以用它实现更多。 – devathon

Rust是专门设计用来帮助程序员用最少的代码做最多的事情,它包括很多强大而有用的功能特性。例如,Rust的match功能可以让你以十分简洁地方式写出灵活的、富有表现力的逻辑:

fn is_prime(n: u64) -> bool {
    match n {
        0...1 => false,
        _ => !(2..n).any(|d| n % d == 0),
    }
}

因为Rust做了很多事情,这意味着有很多东西需要学习,特别是在开始的时候。但这没关系:在C++或Java中也有很多东西要学,而且你不会得到Rust的高级特性,比如内存安全。

批评Rust是一种复杂的语言忽略了一点:它被设计成具有表现力,这意味着有很多功能,而在许多情况下,这正是你想要的编程语言。

当然,Rust有一个学习曲线,但一旦你开始使用它,你就会好起来。

对于那些准备接受更复杂的语法和语义(以及可能更高的可读性成本)以换取最大可能的性能的程序员来说,Rust将与C++和D语言争夺思想份额。 – 戴夫-切尼

虽然Rust采用了Go的一些特性,而Go也在采用Rust的一些特性(尤其是泛型),但可以说Rust的特性很重,而Go的特性相对较轻。

并发

大多数语言都对并发编程(同时做多件事情)有某种形式的支持,但Go从一开始就是为这项工作而设计的。Go不使用操作系统的线程,而是提供了一个轻量级的替代方案:goroutine

每个goroutine是一个独立执行的Go函数,Go调度器会将其映射到其控制下的一个操作系统线程中。这意味着调度器可以非常有效地管理大量并发的goroutine,只使用有限的操作系统线程。

因此,你可以在一个程序中运行数百万个并发的goroutine,而不会产生严重的性能问题。这使得Go成为高规模并发应用程序的完美选择,如网络服务器和微服务。

Go还具有快速、安全、高效的功能特性,可以使用channel让goroutines进行通信和共享数据。Go的并发支持感觉设计得很好,使用起来也很愉快。

一般来说,对并发程序进行推断是很难的,而且在任何语言中建立可靠、正确的并发程序都是一个挑战。但由于它从一开始就内置于语言中,而不是事后才想到的,Go中的并发编程是最简单、最完整的。

Go语言可以很容易地建立一个很好的多因素的应用程序,充分利用并发性,同时作为一组微服务进行部署。Rust也可以做这些事情,但可以说它更难。 在某些方面,Rust对防止与内存有关的安全漏洞的痴迷意味着程序员必须不遗余力地执行那些在其他语言(包括Go)中会更简单的任务。 – Sonya Koptyev

相比之下,Rust中的并发故事是非常新的,而且还在稳定中,但它正处于非常积极的开发中,所以请关注这个领域。例如,Rust的rayon库提供了一种非常优雅和轻量级的方式来将顺序计算转化为并行计算。

拥有goroutines和使用channel的轻量级语法真的很好。这真的显示了语法的力量,这些小细节使并发编程比其他语言感觉好得多 – 一个Rust程序员对Go的早期印象

虽然在Rust中实现并发程序可能不那么简单,但还是有可能的,而且这些程序可以利用Rust的安全保证。

一个很好的例子是标准库的Mutex类:在Go中,你可以忘记在访问某些东西之前获得一个Mutex锁,但Rust不会让你这样做。

Go专注于将并发性作为一个一等公民的概念。这并不是说你不能在Rust中找到Go的面向actor的并发性,但这是留给程序员的一个练习。 – Dave Cheney

安全

我们在前面看到,Go和Rust都以不同的方式来防止一大类与内存管理有关的常见编程错误。但是Rust尤其努力确保你不会做一些你不想做的不安全的事情。

Rust的编译器非常严格和学究派,它检查你使用的每个变量和你引用的每个内存地址。它避免了可能的数据竞争条件,并告知你未定义的行为。并发和内存安全问题在Rust的安全子集中根本不可能发生。 – 为什么是Rust?

这将使Rust编程成为与几乎所有其他语言不同的体验,而且一开始可能是一种挑战。但对很多人来说,这种辛苦是值得的。

对我来说,Rust的关键优势是一种感觉,即编译器是我的后盾,不会让它可能检测到的任何错误通过(说真的,有时感觉就像魔法一样)。 – Grzegorz Nosek

包括Go在内的许多语言都有帮助程序员避免错误的设施,但Rust将这一点提高到了一个新的水平,因此可能不正确的程序甚至不会被编译。

有了Rust,库程序员有很多工具来防止他/她的用户犯错。Rust让我们有能力说,我们拥有一块特定的数据;其他东西不可能声称拥有,所以我们知道没有其他东西能够修改它。我想不出以前有什么时候我被赋予过这么多工具来防止意外的误用。这是一种奇妙的感觉。 – 山姆-罗斯

“与借用检查器(borrow checker)斗争”是Rust程序员新手的常见综合症,但在大多数情况下,它所发现的问题是你的代码中真正的bug(或至少是潜在的bug)。它可能会迫使你从根本上重构你的程序,以避免遇到这些问题;而当正确性和可靠性是你的首要任务时,这是件好事。

一个不改变你编程方式的语言有什么意义呢?当你用其他语言工作时,Rust所教授的关于安全的课程也是有用的。

如果你选择了Rust,通常你需要该语言提供的保证:针对空指针和数据竞争的安全,可预测的运行时行为,以及对硬件的完全控制。如果你不需要这些功能,Rust可能是你下一个项目的糟糕选择。这是因为这些保证是有代价的:入门时间。你需要戒掉坏习惯,学习新概念。有可能的是,当你开始的时候,你会经常和借用检查器斗争。 – Matthias Endler

你觉得Rust的编程模型有多大的挑战性,可能取决于你以前有哪些其他语言的经验。Python或Ruby程序员可能会发现它的限制性;其他人会很高兴。

如果你是一个花了几周的时间来追寻内存安全漏洞的C/C++程序员,你会非常欣赏Rust。”与借用检查器斗争”变成了”编译器可以检测到这个?酷!” -Grzegorz Nosek

规模化

今天的服务器程序由数千万行代码组成,由数百甚至数千名程序员进行构建,而且每天都在更新。Go的设计和开发是为了使在这种环境中工作更有成效。Go的设计考虑包括严格的依赖性管理,随着系统的发展,软件架构的适应性,以及组件之间的健壮性。 – Rob Pike

当你一个人或在小团队中处理问题时,选择简单的语言还是功能丰富的语言是一个偏好的问题。但是当软件越来越大,越来越复杂,团队越来越大时,差异就开始显现出来了。

对于大型应用程序和分布式系统来说,执行速度不如开发速度重要:像Go这样刻意简化的语言可以减少新开发人员的启动时间,并使他们更容易处理大型代码库的工作。

有了Go,作为初级开发者更容易提高工作效率,而作为中级开发者则更难引入会导致后续问题的脆弱抽象。由于这些原因,Rust在企业软件开发方面不如Go有说服力。 – Loris Cro

当涉及到大型的软件开发时,清晰的比聪明的好。Go的局限性实际上使它比Rust等更复杂和强大的语言更适合企业和大机构。

Rust和Go的不同点

虽然Rust和Go都是流行的、现代的、广泛使用的语言,但它们并不是真正的竞争对手,因为它们故意针对的是完全不同的使用情况。

Go的整个编程方法与Rust的完全不同,每一种语言都适合一些人,同时也会刺激另一些人。这完全没问题,如果Rust和Go都能以或多或少相同的方式做同样的事情,我们就不会真的需要两种不同的语言。

那么,我们是否可以通过发现Rust和Go所采取的截然不同的方法来了解它们各自的本性呢?让我们拭目以待。

垃圾回收

“要不要垃圾回收”是一个没有正确答案的问题。垃圾回收,以及一般的自动内存管理,使得开发可靠、高效的程序变得快速和容易,对于一些人来说,这至关重要。

但也有人说,垃圾回收及其性能开销和停顿,使程序在运行时表现得不可预测,并引入了不可接受的延迟。争论还在继续。

Go是一种与Rust非常不同的语言。虽然两者都可以被模糊地描述为系统语言或C语言的替代品,但它们有不同的目标和应用、语言设计的风格以及优先级。垃圾回收是一个真正巨大的区别。Go中的GC使语言更简单,更小,更容易推理。在Rust中没有GC会让它变得非常快(尤其是当你需要保证延迟,而不仅仅是高吞吐量的时候),并且可以实现Go中不可能实现的功能和编程模式(或者至少是在不牺牲性能的情况下)。 – PingCAP

接近机器

计算机编程的历史是一个越来越复杂的抽象的故事,它让程序员在解决问题时不用太担心底层机器的实际运作。

这使得程序更容易编写,也许更容易移植。但是对于许多程序来说,对硬件的访问以及对程序执行方式的精确控制更为重要。

Rust的目标是让程序员“更接近机器”,有更多的控制权,但Go抽象了架构细节,让程序员更接近问题。

两种语言都有不同的适用范围。Go在编写微服务和典型的”DevOps”任务方面表现出色,但它不是一种系统编程语言。Rust对于那些看重并发性、安全性和性能的任务中更强;但它的学习曲线比Go更陡峭。 – Matthias Endler

必须运行更快

许多人同意,对于大多数程序来说,性能不如可读性重要。但当性能确实重要时,它真的很重要。Rust做了一些设计上的权衡,以达到尽可能好的执行速度。

相比之下,Go更关注简单性,它愿意为此牺牲一些(运行时)性能。但是Go的构建速度是无可匹敌的,这对于大型代码库来说是非常重要的。

Rust比Go快。在基准测试中,Rust更快,在某些情况下,甚至是数量级的快。但在你选择用Rust写所有东西之前,考虑一下Go在许多基准测试中并不落后于它,而且它仍然比Java、C#、JavaScript、Python等快得多。如果你需要的是顶级的性能,那么选择这两种语言中的任何一种,你都会在游戏中领先。如果你正在构建一个处理高负载的网络服务,你希望能够在纵向和横向上进行扩展,那么这两种语言都会非常适合你。- 安德鲁-拉德

正确性

另一方面,如果一个程序不需要正常工作的话,它可以任意地快。大多数代码不是为长期而写的,但有些程序能在生产中运行多长时间往往是令人惊讶的:在某些情况下,可以保持几十年。

在这种情况下,值得在开发中多花一点时间,以确保程序的正确性、可靠性,并在未来不需要大量的维护。

Go和Rust都旨在帮助你编写正确的程序,但方式不同。例如,Go提供了一个极好的内置测试框架,而Rust则专注于使用其借用检查器消除运行时的错误。

我认为。Go适用于明天必须交付的代码,而Rust适用于必须在未来五年内保持运行不动的代码。 – Grzegorz Nosek

虽然Go和Rust对于任何严肃的项目来说都是很好的选择,但是让自己尽可能地了解每种语言及其特点是一个好主意。

归根结底,别人怎么想并不重要:只有你能决定哪种语言适合你和你的团队。

如果你想加快开发速度,也许是因为你有许多不同的服务需要编写,或者你有一个庞大的开发团队,那么Go是你的首选语言。Go把并发性作为第一等公民给你,并且不容忍不安全的内存访问(Rust也是如此),但不强迫你管理每一个细节。Go是快速和强大的,但它避免了使开发者陷入困境,而是专注于简单性和统一性。如果在另一方面,拧出每一盎司的性能是必要的,那么Rust应该是你的选择。 – 安德鲁-拉德

结论

我希望这篇文章能让你相信Rust和Go都值得你认真考虑。如果可能的话,你应该争取在这两种语言中至少获得一定程度的经验,因为它们对你的任何技术职业都会有极大的帮助,甚至如果你仅把编程作为一种业余爱好的话。

如果你只有时间投资学习一门语言,在你将Go和Rust用于各种不同类型的大小程序之前,不要做出最终决定。

而编程语言的知识实际上只是成为一名成功的软件工程师的一小部分。到目前为止,你需要的最重要的技能是设计、工程、架构、沟通和协作。如果你在这些方面表现出色,无论你选择哪种语言,你都会成为一名优秀的软件工程师。学习愉快!


“Gopher部落”知识星球旨在打造一个精品Go学习和进阶社群!高品质首发Go技术文章,“三天”首发阅读权,每年两期Go语言发展现状分析,每天提前1小时阅读到新鲜的Gopher日报,网课、技术专栏、图书内容前瞻,六小时内必答保证等满足你关于Go语言生态的所有需求!2023年,Gopher部落将进一步聚焦于如何编写雅、地道、可读、可测试的Go代码,关注代码质量并深入理解Go核心技术,并继续加强与星友的互动。欢迎大家加入!

img{512x368}
img{512x368}

img{512x368}
img{512x368}

著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格5$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

Gopher Daily(Gopher每日新闻)归档仓库 – https://github.com/bigwhite/gopherdaily

我的联系方式:

  • 微博(暂不可用):https://weibo.com/bigwhite20xx
  • 微博2:https://weibo.com/u/6484441286
  • 博客:tonybai.com
  • github: https://github.com/bigwhite

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

让reviewdog支持gitlab-push-commit,守住代码质量下限

本文永久链接 – https://tonybai.com/2022/09/08/make-reviewdog-support-gitlab-push-commit-to-preserve-the-code-quality-floor

一. 代码质量保证的手段

从世界上首款计算机高级程序设计语言Fortran自上世纪50年代诞生以来,编程这个行当已经走过了近70年。虽然年头已不少,但不可否认的一点是:软件生产依然无法像硬件那样标准化,同一个小功能,N个程序员的有N种实现方法

那么如何保证生产出的软件的质量符合我们的要求呢?不同领域的程序员都在进行着努力,比如:做编译器的让编译器更加严格,努力将内存安全问题彻底消除(如Rust);做工具链的为程序员提供了内置于语言的各种单测、集成测试、接口测试、fuzzing test等工具(如Go工具链),让程序员可以更容易地对自己所写的代码进行全方位的测试,以期找出更多的代码中的潜在问题…

当然,还有一种主观的代码质量保证方法目前依旧是主流,它就是是同行的代码评审(code review, cr)

代码评审的方法主要有两种,一种是大家坐到一个会议室中,对某个人的某段代码“发表大论”;另外一种则是利用像gerrit这样的工具,在线对其他人的某次提交的代码或某PR的代码进行“评头论足”。

不过无论哪种,最初的时候大家都会细无巨细地从语法层面看到代码结构设计,再到业务逻辑层面,但这样做的弊端也是很显而易见,那就是效率低下,不聚焦(focus)

于是人们想到了:能否利用工具来尽可能地发现语法层面的问题,这样代码评审时,人类专家便可以聚焦代码结构设计与业务逻辑层面的问题,分工明确后,效率自然提升(如下图):

注:目前绝大多数工具链仅能自动帮助程序员解决语法层面的问题。将来,随着工具的日益强大,工具可以不断升级关注层次,逐渐进化到具备发现代码结构设计问题,甚至可以发现业务层面逻辑问题的能力。

于是就有了reviewdog这样的可以调用各种linter工具对代码进行自动扫描并将问题以comment的形式自动提交的代码仓库的工具。

到这里很多朋友会问,即便让工具来关注语法层面的问题,为何要用reviewdog这样的工具,git的pre-commit hook、git server hooks、利用Make等工具做开发阶段检查等手段也能检查代码中的语法问题,它们不再香了吗?

下面简单看看这些方法的“问题”(我们假设大家都已经在使用git作为代码版本管理工具):

  • git pre-commit-hook

git pre-commit hook是一个客户端的git hook,它是放在开发人员本地代码copy中的.git/hooks目录下的钩子,当开发人员在本地执行git commit时会被唤起执行。pre-commot hook的问题就在于我们没法在中心代码仓库对pre-commit hook的脚本内容做统一管理和维护。这个更适合开发人员根据自己的喜好、代码素养在自己的开发环境下部署。

此外,有些代码并不一定是在开发者自己的开发机上提交的,换环境后,pre-commit hook就不在生效。

  • 利用Make等工具做本地检查

利用make工具,我们可以在本地build代码之前对代码做lint等各种静态检查,但和pre-commit-hook一样,虽然Makefile可以提交代码仓库,但真正用于检查代码的工具依旧是在开发人员本地,难于对工具版本,设定的检查规则进行统一管理维护,可能导致不同开发人员环境有不一致的情况。另外同样的情况,有些代码并不一定是在开发者自己的开发机上提交的,换环境后,Make工具依赖的代码检查工具可能并不存在,检查环节就无法有效实施。

  • git server hooks

git支持server hooksgitlab自12.8版本也开始支持server hooks(替换之前的custom hooks)。

Git server支持以下钩子:

  • pre-receive
  • post-receive
  • update

我倒是没有深研究过这些server hooks是否能满足我们的功能要求,但就git server hooks的部署特点就决定了,它不适合,因为它要在gitlab的server上执行,这就意味着我们需要的所有静态代码检查工具都要部署和配置在与gitlab server同一个环境中,这耦合性太强,根本不便于我们对这些静态代码检查工具的管理与日常维护。

而像reviewdog这样的工具将与ci工具(比如gitlab-ci)集成,运行在slave/worker/runner的机器上,而这些机器上的环境便很容易统一的定制与管理。

好了,下面进入reviewdog时间!

注:我们以代码仓库为gitlab为例,我曾做过小调查,目前企业内部基本都在使用gitlab搭建私有git仓库,除了那些自实现code仓库平台的大厂。

二. reviewdog是什么

reviewdog是一个什么样的工具呢?我们来看看下面这幅示意图:

我们看到,这是一幅基于gitlab的ci执行流程图,在这个流程中,reviewdog运行在gitlab-runner节点,也就是负责真正执行ci job的节点上。每当开发人员执行一次git push,将commit同步到代码仓库,一次ci job将被触发,在承载该ci job的gitlab-runner节点上,reviewdog被唤起,它做了三件事:

  • 调用静态代码检查工具对最新pull下来的代码进行检查;
  • 将代码检查结果(第几行有问题)与commit diff的结果进行比对,得到交集(即commit diff中变更(add和update)的代码行与代码检查结果的行一致的,放入交集中);
  • 将交集中代码检查结果信息以gitlab commit comment的形式post到gitlab仓库中

这样开发人员就可以通过commit页面看到这些comments,并应对这些comment,必要情况下,会修复这些问题。

我们看到reviewdog和其他工具相比,最大的不同就是可以找出commit diff与lint结果中的交集,并与代码仓库交互,将这些交集中的结果以comments的形式放入commit页面,就像同行代码评审时,同行直接在你的commit页面添加comment一样

然而当前版本的reviewdog还不支持直接在gitlab-push-commit上做检查与提交comment,可能是这样的场景较为少见,因为目前开源项目更多采用基于pr(pull request)的工作流,所以reviewdog内置了诸如github-pr-check、github-pr-review、gitlab-mr-commit等工作流的代码review。而像我们使用的基于gitlab-push-commit可能并不多见(当然我们内部使用这种也是有特定上下文的)。

那么如何让reviewdog支持gitlab-push-commit,即对push动作中的commit进行静态代码检查并将结果以comment的形式放入commit页面呢?我们只能fork reviewdog项目,并在fork后的项目中自行添加对gitlab-push-commit模式的支持。

三. 改造reviewdog以支持gitlab-push-commit模式

reviewdog就是一个命令行工具,通常就是一次性执行,因此它的代码结构较为清晰。我们可以简单围绕它支持的几种reporter模式来搞清楚如何增加对gitlab-push-commit模式的支持。

这里说明一下gitlab-push-commit模式的含义,首先该模式适用于开发人员通过git push推送代码到gitlab时触发的ci job。在该ci job中,reviewdog会运行配置的静态代码分析工具(比如golangci-lint等)对最新的代码进行扫描,并得到问题集合;然后获取最新的commit的sha值(CI_COMMIT_SHA)以及push之前的latest commit的sha值(CI_COMMIT_BEFORE_SHA),并比较这两个版本间的diff。最后通过文件名与行号将问题集合与diff集合中的“交集”找出来,并将结果以comment形式通过gitlab client api提交到的此次push的最新的那个commit的页面。

目前该模式尚存在一个“瑕疵”,那就是如果一个push中有多个commit,那么gitlab-push-commit模式不会针对每个commit做diff和comment,而只是会用push中的latest commit与push之前的最新commit做比较。

定义清除gitlab-push-commit模式含义后,我们就可以“照葫芦画瓢”的为reviewdog增加该模式的支持了!

在main.go中,我们主要是在run函数中增加一个reporter case分支:

// https://github.com/bigwhite/reviewdog/blob/master/cmd/reviewdog/main.go
func run(r io.Reader, w io.Writer, opt *option) error {
... ...

case "gitlab-push-commit":
    build, cli, err := gitlabBuildWithClient(opt.reporter)
    if err != nil {
        return err
    }
    log.Printf("reviewdog: [gitlab-push-commit-report] gitlabBuildWithClient ok\n")

    gc, err := gitlabservice.NewGitLabPushCommitsCommenter(cli, build.Owner, build.Repo, build.SHA)
    if err != nil {
        return err
    }
    log.Printf("reviewdog: [gitlab-push-commit-report] NewGitLabPushCommitsCommenter ok\n")

    cs = reviewdog.MultiCommentService(gc, cs)
    ds, err = gitlabservice.NewGitLabPushCommitsDiff(cli, build.Owner, build.Repo, build.SHA, build.BeforeSHA)
    if err != nil {
        return err
    }
    log.Printf("reviewdog: [gitlab-push-commit-report] NewGitLabPushCommitsDiff ok\n")
... ...

}

在这个case中,我们主要是为后面的project.Run或reviewdog.Run方法准备gitlab client对象、PushCommitsCommenter对象(位于service/gitlab/gitlab_push_commits.go中)、PushCommitsDiff对象(位于service/gitlab/gitlab_push_commits_diff.go中)等。

gitlab_push_commits.go和gitlab_push_commits_diff.go是新增的两个go源文件,也是参考了同目录下的gitlab_mr_commit.go和gitlab_mr_diff.go改写而成的。具体代码这里就不列出来了,大家有兴趣可以自行阅读。

四. 部署gitlab-runner验证新版reviewdog

下面我们就来验证一下上述改造后的reviewdog。

1. 安装gitlab-runner

我们先在gitlab上建立一个实验项目,然后为该项目配置ci。如果你的gitlab还没有注册gitlab-runner,可以按下面步骤安装和注册runner节点(可以在顶层group下面建立,这样runner可以在group内共享:settings => CI/CD => Runners => Show runner installation instructions 有部署runner的详细命令说明):

//假设我们有一个ubuntu 20.04的主机,我们可以按下面命令安装和注册一个gitlab-runner:

sudo curl -L --output /usr/local/bin/gitlab-runner https://gitlab-runner-downloads.s3.amazonaws.com/latest/binaries/gitlab-runner-linux-amd64

# Give it permissions to execute
sudo chmod +x /usr/local/bin/gitlab-runner

# Create a GitLab CI user
sudo useradd --comment 'GitLab Runner' --create-home gitlab-runner --shell /bin/bash

# Install and run as service
sudo gitlab-runner install --user=gitlab-runner --working-directory=/home/gitlab-runner
sudo gitlab-runner start

# 注册该runner
sudo gitlab-runner register --url http://{gitlab-server-ip-addr}/ --registration-token {registration token}

上面命令会在/etc/gitlab-runner下面建立一个runner自用配置文件:config.toml:

//  /etc/gitlab-runner/config.toml

concurrent = 1
check_interval = 0

[session_server]
  session_timeout = 1800

[[runners]]
  name = "runner for ard group"
  url = "http://gitlab_ip_addr/"
  id = 1
  token = "{registration token}"
  token_obtained_at = 2022-09-01T11:03:43Z
  token_expires_at = 0001-01-01T00:00:00Z
  executor = "shell"
  shell = "bash"
  environment = ["PATH=/home/tonybai/.bin/go1.18/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin"]
  [runners.custom_build_dir]
  [runners.cache]
    [runners.cache.s3]
    [runners.cache.gcs]
    [runners.cache.azure]

这里我选择了shell executor,即基于主机shell执行ci job中的命令。runners下的environment可以设置shell的环境变量,这里的设置将覆盖对应账号(比如gitlab-runner)下的环境变量值。

gitlab-runner部署成功后,我们在group的runners下面便可以看到下面的available runners:

注:在创建runner时,我为该runner设置了两个tag:ard和ci。

注:确保runner执行的命令在主机的PATH下面可以找到。

2. 创建personal access token

reviewdog需要通过gitlab client API访问gitlab仓库获取信息并提交comments,这就需要我们为runner执行的命令提供access token。

gitlab有多种access token,比如:personal access token、project access token等。我们创建personal access token,我也测试过project access token,使用project access token可以成功提交comment,但是notify mail十有八九无法发送出来。

access token要保存好,因为它只显示一次。

我们将personal access token配置到实验项目的variable中(Settings => CI/CD => variables),variable的key为REVIEWDOG_GITLAB_API_TOKEN,值为刚刚创建的token。

后续每次CI job执行,该variable会作为预定义的环境变量对job生效。我们的reviewdog便可以使用该token访问gitlab。

3. 配置实验项目的ci pipeline

我们可以通过代码的形式配置实验项目的ci pipeline,我们在项目根目录下建立.gitlab-ci.yml文件,其内容如下:

// .gitlab-ci.yml

build-job:
  tags:
      - ard
  stage: build
  script:
    - export CI_REPO_OWNER=ard/incubators
    - export CI_REPO_NAME=learn-gitlab
    - reviewdog -reporter=gitlab-push-commit
  only:
    - master
    - pushes

.gitlab-ci.yml的具体字段含义可以参考gitlab文档。在这个配置中,值得注意的有几点:

  • 使用tags关联runner(这里用ard这个tag);
  • script部分是job具体执行的命令列表,这里先设置CI_REPO_OWNER和CI_REPO_NAME两个环境变量,供reviewdog使用;然后执行reviewdog;
  • only部分描述仅针对master分支的push事件触发ci job。

4. 配置.reviewdog.yml

最后,我们来配置一下适合实验项目的reviewdog的配置文件。我们同样在项目根目录下建立.reviewdog.yml文件,其内容如下:

runner:
  golangci:
    cmd: golangci-lint run --max-same-issues=0 --out-format=line-number ./...
    errorformat:
      - '%E%f:%l:%c: %m'
      - '%E%f:%l: %m'
      - '%C%.%#'
    level: warning

在这里我们看到,我们使用golangci-lint这个静态检查工具对实验项目的代码进行检查。这里的–max-same-issues=0的含义是不限制相同错误的数量。至于.reviewdog.yml的具体格式,reviewdog项目自身的.reviewdog.yml很具参考价值,大家需要时可以仔细研究。

5. 推送代码并验证reviewdog的执行结果

我们可以故意在代码中写下有问题的一些代码,这些问题要保证可以被golangci-lint工具扫描出来,比如:

package main

type Foo struct {
    A int
    B string
    C bool
}

func Demo1() error {
    return nil
}

func Demo2() error {
    return nil
}

func Demo3() error {
    return nil
}

func main() {
    f := &Foo{1, "tony", false}
    _ = f
    Demo2()
    Demo1()
    Demo3()
}

这里并没有对Demo函数调用进行错误处理,golangci-lint中的errcheck可以检测出这个问题。提交并push这些代码到仓库,稍等片刻,我们便可收到notify mail,打开commit页面,便会看到下面这样的commit comments:

看到这样的结果,说明reviewdog按预期工作了!

五. 小结

本文介绍了如何基于reviewdog对push提交的commit进行静态代码检查并像一个“同行”一样在commit中提交评论的方法。

这样做的目的就是希望通过工具提升代码评审的效率,同时也守住代码质量的下限。

就像本文开始所说的那样,随着检查工具能力的增强,这样的基于reviewdog自动检查代码的方案在保证代码质量方面还可以继续提升。

Go开源了go/ast等工具链,有能力的童鞋可以基于go/ast自行开发具有“特定目的”的检查工具并集成到reviewdog中,这将使得检查更有针对性和有效性。

本文涉及源码在这里下载 – https://github.com/bigwhite/reviewdog/


“Gopher部落”知识星球旨在打造一个精品Go学习和进阶社群!高品质首发Go技术文章,“三天”首发阅读权,每年两期Go语言发展现状分析,每天提前1小时阅读到新鲜的Gopher日报,网课、技术专栏、图书内容前瞻,六小时内必答保证等满足你关于Go语言生态的所有需求!2022年,Gopher部落全面改版,将持续分享Go语言与Go应用领域的知识、技巧与实践,并增加诸多互动形式。欢迎大家加入!

img{512x368}
img{512x368}

img{512x368}
img{512x368}

我爱发短信:企业级短信平台定制开发专家 https://tonybai.com/。smspush : 可部署在企业内部的定制化短信平台,三网覆盖,不惧大并发接入,可定制扩展; 短信内容你来定,不再受约束, 接口丰富,支持长短信,签名可选。2020年4月8日,中国三大电信运营商联合发布《5G消息白皮书》,51短信平台也会全新升级到“51商用消息平台”,全面支持5G RCS消息。

著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格5$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

Gopher Daily(Gopher每日新闻)归档仓库 – https://github.com/bigwhite/gopherdaily

我的联系方式:

  • 微博:https://weibo.com/bigwhite20xx
  • 博客:tonybai.com
  • github: https://github.com/bigwhite

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言精进之路1 Go语言精进之路2 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats