标签 goroutine 下的文章

Go语言之父的反思:我们做对了什么,做错了什么

本文永久链接 – https://tonybai.com/2024/01/07/what-we-got-right-what-we-got-wrong

在《2023年Go语言盘点:稳中求新,稳中求变》和《Go测试的20个实用建议》两篇文章中,我都提到过已经退居二线的Go语言之父Rob PikeGo开源14周年的那天亲自在GopherCon Australia 2023上发表了“What We Got Right, What We Got Wrong”的主题演讲来回顾Go诞生以来的得与失。近期Rob Pike终于将这次演进的文字稿发布了出来GopherCon Australia也在油管上发布了这个演进的视频。Rob Pike的观点对所有Gopher都是极具参考价值的,因此在这篇博文中,我将Rob Pike的这次演讲稿翻译成中文,供大家参考(结合文字稿和视频),我们一起来领略和学习大师的观点。


这是2023年11月10日我在悉尼GopherConAU 2023会议上的闭幕演讲(视频),那一天也是Go开源14周年的日子。本文中穿插着演示文稿中使用的幻灯片。

介绍

大家好!

首先,我要感谢Katie和Chewy让我有幸为此次GopherConAU大会做闭幕演讲。


2009年11月10日

今天是2023年11月10日,Go作为开源项目推出14周年的纪念日。

2009年11月10日那天,加州时间下午3点(如果没记错的话),Ken Thompson、Robert Griesemer、Russ Cox、Ian Taylor、Adam Langley、Jini Kim和我满怀期待地看着网站上线。之后,全世界都知道我们在做什么了。

14年后的今天,有很多事情值得回顾。我想借此机会谈谈自那一天以来学到的一些重要经验。即使是最成功的项目,在反思之后,也会发现一些事情本可以做得更好。当然,也有一些事情事后看来似乎是成功的关键所在。

首先,我必须明确的是,这里的观点只代表我个人,不代表Go团队和Google。无论是过去还是现在,Go都是由一支专注的团队和庞大的社区付出巨大努力的结果。所以,如果你同意我的任何说法,请感谢他们。如果你不同意,请责怪我,但请保留你的意见。

鉴于本次演讲的题目,许多人可能期待我会分析语言中的优点和缺点。当然,我会做一些分析,但还会有更多内容,原因有几个。

首先,编程语言的好坏很大程度上取决于观点而不是事实,尽管许多人对Go或任何其他语言的最微不足道的功能都存在争论。

另外,关于换行符的位置、nil的工作方式、导出的大小写表示法、垃圾回收、错误处理等话题已经有了大量的讨论。这些话题肯定有值得讨论的地方,但几乎没什么是还没有被讨论过的。

但我要讨论的不仅仅是语言本身的真正原因是,语言并不是整个项目的全部。我们最初的目标不是创造一种新的编程语言,而是创造一种更好的编写软件的方式。我们对所使用的语言有意见——无论使用什么语言,每个人都是如此——但是我们遇到的基本问题与这些语言的特性没有太大关系,而是与在谷歌使用这些语言构建软件的过程有关。


T恤上的第一只Gopher

新语言的创建提供了探索其他想法的新路径,但这只是一个推动因素,而不是真正的重点。如果当时我正在工作的二进制文件不需要45分钟来构建
,Go语言就不会出现。但那45分钟不是因为编译器慢(因为它不慢),也不是因为它所用的语言不好(因为它也不差)。缓慢是由其他因素造成的。

我们想解决的就是这些因素:构建现代服务器软件的复杂性:控制依赖性、与人员不断变化的大型团队一起编程、可维护性、高效测试、多核CPU和网络的有效利用等等。

简而言之,Go不仅仅是一种编程语言。当然,它是一种编程语言,这是它的定义。但它的目的是帮助提供一种更好的方式来开发高质量的软件,至少与14多年前的我们的环境相比。

时至今日,这仍然是它的宗旨。Go是一个使构建生产软件更容易、更高效的项目。

几周前,当我开始准备这次演讲时,我只有一个题目,除此之外别无其他。为了激发我的思路,我在Mastodon上向人们征求意见。不少人给予了回复。我注意到了一种趋势:人们认为我们做错的事情都在语言本身,而我们做对的事情都在语言周边,比如gofmt、部署和测试等。事实上,我觉得这令人鼓舞。我们试图做的事情似乎已经产生了效果。

但值得承认的是,我们在早期并没有明确真正的目标。我们可能觉得这些目标是不言自明的。为了弥补这一缺陷,我在2013年的SPLASH会议上发表了一场题为《谷歌的Go语言:面向软件工程的语言设计》的演讲。


Go at Google

那场演讲和相关的博客文章可能是对Go语言为何而生的最好诠释。

今天的演讲是SPLASH演讲的后续,回顾了我们在构建语言之后所学到的经验教训,并且可以更广泛地应用于更大的图景。

那么……来谈谈一些教训。

首先,当然,我们有:

The Gopher

以Go Gopher吉祥物开始可能看起来是一个奇怪的起点,但Go gopher是Go成功的最早因素之一。在发布Go之前,我们就知道我们想要一个吉祥物来装饰周边商品——每个项目都需要周边商品——Renee French主动提出为我们制作一个这样的吉祥物。在这一点上,我们做得非常正确。

下面最早的Gopher毛绒玩具的图片:


The Gopher

这是Gopher的照片,它的第一个原型不太成功。


Gopher和它进化程度较低的祖先

Gopher是一个吉祥物,它也是荣誉徽章,甚至是世界各地Go程序员的身份标志。此时此刻,你正在参加一个名为GopherCon的会议,这是众多GopherCon会议中的一个。拥有一个从第一天就准备好分享信息的容易识别、有趣的生物,对Go的成长至关重要。它天真又聪明——它可以构建任何东西!


Gopher建造机器人(Renee French 绘图)

它为社区参与该项目奠定了基调,这是卓越的技术与真正的乐趣相结合的基调。最重要的是,Gopher是社区的一面旗帜,一面团结起来的旗帜,尤其是在早期,当Go还是编程界的新贵时。

这是几年前Gopher参加巴黎会议的照片,看看他们多兴奋!


巴黎的Gopher观众(Brad Fitzpatrick摄)

尽管如此,在知识共享署名许可(Creative Commons Attribution license)下发布Gopher的设计也许不是最好的选择。一方面,它鼓励人们以有趣的方式重新组合他,这反过来又有助于培养社区精神。


Gopher model sheet

Renee创建了一个“模型表”来帮助艺术家在保持其精神原貌的同时进行艺术创作。

一些艺术家利用这些特征制作了自己版本的Gopher并获得了乐趣;Renee和我最喜欢的版本是日本设计师@tottie的和游戏程序员@tenntennen的:


@tottie的Gopher


@tenntennen 的gopher

但许可证的“归属”部分常常会导致令人沮丧的争论,或者导致Renee的创作不属于她,也不符合原作的精神。而且,说实话,这种归属往往只是不情愿地得到尊重,或者根本没有得到尊重。例如,我怀疑@tenntennen是否因他的Gopher插图被使用而获得补偿或是得到承认。


gophervans.com: Boo!

因此,如果让我们重来一次,我们会认真思考确保吉祥物忠于其理想的最佳方法。维护吉祥物是一件很难的事,而且解决方案仍然难以捉摸。

但更多的是技术性的事情。

做的对的事情

这里有一份我认为我们在客观上做对了的事情的清单,特别是在回顾的时候。并不是每一个编程语言项目都做了这些事情,但清单中的每一件对Go的最终成功都至关重要。我会试着言简意赅,因为这些话题都已为人所熟知。

1. 语言规范(Specification)

我们从正式的语言规范开始。这不仅可以在编写编译器时锁定行为,还可以使多个编译器实现共存并就该行为达成一致。编译器本身并不是一个规范。你测试编译器的依据是什么?


Web上的Go语言规范

哦,顺便说一句,该规范的初稿是在这里编写的,位于悉尼达令港一栋建筑的18层。我们正在Go的家乡庆祝Go的生日。

2. 多种实现

Go有多个编译器实现,它们都实现相同的语言规范。有了规范就可以更容易地实现这一点。

有一天,伊恩·泰勒(Ian Taylor)发邮件通知我们,在阅读了我们的语言规范草案后,他自己编写了一个编译器,这让我们感到惊讶!

Subject: A gcc frontend for Go
From: Ian Lance Taylor
Date: Sat, Jun 7, 2008 at 7:06 PM
To: Robert Griesemer, Rob Pike, Ken Thompson

One of my office-mates pointed me at http://.../go_lang.html .  It
seems like an interesting language, and I threw together a gcc
frontend for it.  It's missing a lot of features, of course, but it
does compile the prime sieve code on the web page.

这的确令人兴奋,但更多的编译器实现也随之而来了,所有这些都因正式规范的存在而成为可能。


很多编译器

拥有多个编译器帮助我们改进了语言并完善了规范,并为那些不太喜欢我们类似Plan-9的业务方式的其他人提供了替代环境。稍后会详细介绍。如今有很多兼容的实现,这很棒!

3. 可移植性

我们使Go应用的交叉编译变得轻而易举,程序员可以在他们喜欢的任何平台上工作,并交付到任何需要的平台。使用Go可能比使用任何其他语言更容易达成这一点。很容易将编译器视为运行它的机器的本地编译器,但没有理由这么认为。打破这个假设具有重要意义,这对许多开发者来说都是新鲜事。


可移植性

4. 兼容性

我们努力使语言达到1.0版本的标准,然后通过兼容性保证将其固定下来,这对Go的采用产生了非常明显的影响!我不理解为什么大多数其他项目一直在抵制这样做。是的,保持强大兼容性的确需要付出成本,但它可以阻止功能特性停滞,而在这个几乎没有其他东西保持稳定的世界里,不必担心新版本的Go会破坏你的项目,这足以令人感到欣喜!


Go兼容性承诺

5. 标准库

尽管它的增长在某种程度上是偶然的,因为在一开始没有其他地方可以安装Go代码,但拥有一个坚实、制作精良的标准库,其中包含编写21世纪服务器代码所需的大部分内容,这是一个重大资产。在我们积累了足够的经验来理解还应该提供什么之前,它使整个社区都使用相同的工具包。这非常有效,并有助于防止出现不同版本的库,从而帮助统一社区。


标准库

6. 工具

我们确保该语言易于解析,从而支持工具构建。起初我们认为Go需要一个IDE,但易于构建工具意味着,随着时间的推移,IDE将会出现在Go上。他们和gopls一起做到了,而且他们非常棒。


工具

我们还为编译器提供了一套辅助工具,例如自动化测试、覆盖率和代码审查(code vetting)。当然还有go命令,它集成了整个构建过程,也是许多项目构建和维护其Go代码所需的一切。


快速构建

此外,Go获得了快速构建的声誉,这也没有什么坏处。

7. Gofmt

我将gofmt作为一个单独的项目从工具中拿出来,因为它是一个不仅在Go上而且在整个编程社区上留下了印记的工具。在Robert编写gofmt之前(顺便说一句,他从一开始就坚持这样做),自动格式化程序的质量不高,因此大多未被使用。


gofmt谚语

gofmt的成功表明了代码自动格式化可以做得很好,今天几乎每种值得使用的编程语言都有一个标准格式化程序。我们不再为空格和换行符争论,这节省了大量时间了,这也让那些花在定义标准格式和编写这段相当困难的代码实现格式自动化上的时间显得超值。

此外,gofmt还使无数其他工具成为可能,例如简化器、分析器甚至是代码覆盖率工具。因为gofmt的内容成为了任何人都可以使用的库,所以你可以解析程序、编辑AST,然后打印完美的字节输出,供人类和机器使用。

谢谢,罗伯特。

不过,恭喜你就够了。接下来,我们来谈谈一些更有争议的话题。

并发性

并发有争议吗?嗯,在我2002年加入谷歌的那年肯定有。John Ousterhout曾说过:线程很糟糕。许多人都同意他的观点,因为线程似乎非常难以使用。


John Ousterhout不喜欢线程

谷歌的软件几乎总是避免使用它们,可以说是彻底禁止使用,而制定这一禁令的工程师引用了Ousterhout的言论。这让我很困扰。自20世纪70年代以来,我一直在做类似的并发事情,有时候甚至没有意识到,在我看来这很强大。但经过反思,很明显Ousterhout犯了两个错误。首先,他的结论超出了他有兴趣使用线程的领域,其次,他主要是在抱怨使用笨拙的低级包如pthread之类的线程,而不是抱怨这一基本思想。

像这样混淆解决方案和问题是世界各地工程师常犯的错误。有时,提出的解决方案比它解决的问题更难,并且很难看到有更简单的路径。但我离题了。

根据经验,我知道有更好的方法来使用线程,或者无论我们选择怎么称呼它们,我甚至在Go语言出现之前就曾就此发表过演讲。


Newsqueak中的并发

但我并不孤单,其他许多语言、论文甚至书籍都表明,并发编程可以做得很好,不仅我知道这一点。它只是还没有在主流中流行起来,Go的诞生部分地就是为了解决这个问题。在那次臭名昭著的45分钟构建中,我试图向一个非线程二进制文件添加一个线程,这非常困难,因为我们使用了错误的工具。

回顾过去,我认为可以公平地说,Go在让编程界相信并发是一种强大工具方面发挥了重要作用,特别是在多核网络世界中,它可以比pthread做得更好。如今,大多数主流语言都对并发提供了很好地支持。


Google 3.0

另外,Go的并发版本在导致它出现的语言线中有些新颖,因为它使goroutine变得平淡无奇。没有协程,没有任务,没有线程,没有名称,只有goroutine。我们发明了“goroutine”这个词,因为没有适合的现有术语。时至今日,我仍然希望Unix的拼写命令可以学会它。

顺便说一句,因为我经常被问到,让我花一分钟时间谈谈async/await。看到async/await模型及其相关风格成为许多语言选择支持并发的方式,我有点难过,但它肯定是对pthreads的巨大改进。

与goroutine、channel和select相比,async/await对语言实现者来说更容易也更小,可以更容易地内建或后移植到现有平台中。但它将一些复杂性推回给了程序员,通常会导致Bob Nystrom所著名的“彩色函数”。


你的函数是什么颜色的

我认为Go表明了CSP这种不同但更古老的模型可以完美地嵌入到过程化语言中,没有这种复杂性。我甚至看到它几次作为库实现。但它的实现,如果做得好,需要显著的运行时复杂性,我可以理解为什么一些人更倾向于不在他们的系统中内置它。不管你提供什么并发模型,重要的是只提供一次,因为一个环境提供多个并发实现可能会很麻烦。Go当然通过把它放在语言中而不是库中解决了这个问题。

关于这些问题可能要讲整场演讲,但目前就这些吧。

并发的另一个价值在于,它使Go看起来像是全新的东西。如我所说,一些其他语言在之前已经支持了它,但它们从未进入主流,而Go对并发的支持是吸引初学者采用的一个主要因素,它吸引了以前没有使用过并发但对其可能性感兴趣的程序员。

这就是我们犯下两个大错误的地方。


耳语的Gopher(Cooperating Sequential Processes)

首先,并发很有趣,我们很高兴拥有它,但我们设想的使用案例大多是服务器相关的,意在在net/http等关键库中完成,而不是在每个程序的所有地方完成。当许多程序员使用它时,他们努力研究它如何真正帮助他们。我们应该一开始就解释清楚,语言中的并发支持真正带到桌面的是更简单的服务器软件。这个问题空间对许多人很重要,但并非所有尝试Go的人都是如此,这点指导不足是我们的责任。

相关的第二点是,我们用了太长时间来澄清并行和并发之间的区别——支持在多核机器上并行执行多个计算,以及一种组织代码的方式,以便很好地执行并行计算。


并发不是并行

无数程序员试图通过使用goroutine来并行化他们的代码以使其更快,但经常对结果中的速度降低感到困惑。仅当基础问题本质上是并行的时候,例如服务HTTP请求,并发代码才会通过并行化而变快。我们在解释这一点上做得很糟糕,结果让许多程序员感到困惑,可能还赶走了一些人。

为了解决这个问题,我在2012年Waza上给Heroku的开发者大会做了一个题为“并发不是并行”的演讲。这是一次很有趣的演讲,但它应该更早发生。

对此表示歉意。但好处仍然存在:Go帮助普及了并发性作为构建服务器软件的一种方式。

接口

很明显,接口与并发都是Go中与众不同的思想。它们是Go对面向对象设计的答案,采用最初关注行为的风格,尽管新来者一直在努力使结构体承担这一角色。

使接口动态化,无需提前宣布哪些类型实现了它们,这困扰了一些早期评论者,并且仍然恼火一小部分人,但它对Go培育的编程风格很重要。大部分标准库都是建立在它们的基础之上的,而更广泛的主题如测试和管理依赖也高度依赖于它们慷慨的“欢迎所有人”的天性。

我觉得接口是Go中设计最好的部分之一。

除了一些早期关于接口定义中是否应该包括数据的讨论之外,它们在讨论的第一天就已经成形。


GIF 解码器:Go接口的练习(Rob Pike和Nigel Tao 2011)

在这个问题上还有一个故事要讲。

在Robert和我的办公室里那著名的第一天,我们讨论了关于多态性应该怎么处理的问题。Ken和我从C语言中知道qsort可以作为一个困难的测试用例,所以我们三个人开始讨论用我们这种初具雏形的语言如何实现一个类型安全的排序例程(routine)。

Robert和我几乎同时产生了同样的想法:在类型上使用方法来提供排序所需的操作。这个概念很快发展成了一个想法,即值类型拥有作为方法定义的行为,一组方法可以提供函数可以操作的接口。Go的接口几乎立即就出现了。


sort.Interface

有一点没人经常提到:Go的sort函数是作为一个在接口上操作的函数实现的。这与大多数人熟悉的面向对象编程风格不同,但这是一个非常强大的想法。

这个想法对我们来说非常激动人心,它可能成为一个基础的编程构造,这令我们陶醉。当Russ Cox加入时,他很快指出了I/O如何完美地融入这个想法,标准库的发展非常迅速,在很大程度上依赖于三个著名的接口:空接口(interface{})、Writer和Reader,每个接口平均包含两个第三个方法。那些微小的方法对Go来说是惯用法,无处不在。

接口的工作方式不仅成为Go的一个显著特性,它们也成为我们思考库、泛型和组合的方式。这是让人兴奋的事情。

但我们在这个问题上停止讨论可能是一个错误。

你看,我们之所以走上这条路,至少在一定程度上是因为我们看到泛型编程太容易鼓励一种倾向于在算法之前首先关注类型的思考方式。过早抽象而不是有机设计。容器而不是函数。

我们在语言中正确定义了通用容器——map,切片,数组,channel——而不给程序员访问它们所包含的泛型。这可以说是一个错误。我们相信,我认为仍然正确的是,大多数简单的编程任务可以很好地由这些类型来处理。但有一些不能,语言提供的和用户可以控制的之间的障碍肯定困扰了一些人。

简而言之,尽管我不会改变接口的任何工作方式,但它们以需要十多年时间才能纠正的方式影响了我们的思维。Ian Taylor从一开始就推动我们面对这个问题,但在接口作为Go编程基石的情况下,这是相当困难的。

评论者经常抱怨我们应该使用泛型,因为它们“很简单”,在某些语言中可能确实如此,但接口的存在意味着任何新的多态形式都必须考虑到它们。找到一种可以与语言的其余部分很好地协同工作的前进方法需要多次尝试,几次中止的实现,以及许多小时、天数和周数的讨论。最终,在Phil Wadler的带领下,我们召集了一些类型理论家来提供帮助。即使在语言中有了可靠的泛型模型,作为方法集存在的接口也仍然存在一些遗留问题。


泛型版sort

如你所知,最终的答案是设计一个可以吸收更多多态形式的接口泛化,从“方法集合”过渡到“类型集合”。这是一个微妙但深刻的举措,大多数社区似乎都可以接受,尽管我怀疑抱怨声永远不会停止。

有时候要花很多年的时间来弄清楚一些事情,或者甚至弄清楚你并不能完全弄明白它。但你还是要继续前进。

顺便说一句,我希望我们有一个比“泛型”更好的术语,它起源于表示一种不同的数据结构中心多态风格。“参数多态”是Go提供的该功能的正确术语,这是一个准确的术语,但它难听。于是我们依然说“泛型”,尽管它不太恰当。

编译器

困扰编程语言社区的一件事是,早期的Go编译器是用C语言编写的。在他们看来,正确的方式是使用LLVM或类似的工具包,或者用Go语言本身编写编译器,这称为自举。我们没有做这两者中的任何一种,原因有几个。

首先,自举一种新语言要求至少其编译器的第一步必须用现有语言完成。对我们来说,C语言是显而易见的选择,因为Ken已经编写了C编译器,并且其内部结构可以很好地作为Go编译器的基础。此外,用自己的语言编写编译器,同时开发该语言,往往会产生一种适合编写编译器的语言,但这不是我们想要的语言。

早期的编译器工作良好,它可以很好地引导语言。但从某种意义上说,它有点奇怪,实际上它是一个Plan 9风格的编译器,使用旧的编译器编写思想,而不是新的思想,如静态单一赋值(SSA)。生成的代码平庸,内部不太漂亮。但它是务实高效的,编译器代码本身体积适中,对我们来说也很熟悉,这使得我们在尝试新想法时可以快速进行更改。一个关键步骤是添加自动增长的分段堆栈。这很容易添加到我们的编译器中,但是如果我们使用像LLVM这样的工具包,考虑到ABI和垃圾收集器支持所需的更改,将这种更改集成到完整的编译器套件中是不可行的。

另一个工作良好的区域是交叉编译,这直接来自原始Plan 9编译器套件的工作方式。

按照我们的方式行事,无论多么非正统,都有助于我们快速前进。有些人对这一选择感到冒犯,但这对当时的我们来说是正确的选择。


Go 1.5之后的Go编译器架构

对于Go 1.5版本,Russ Cox编写了一个工具,可以半自动将编译器从C转换为Go。到那时,语言已经完成,编译器导向的语言设计的担忧也就无关紧要了。有一些关于这个过程的在线演讲值得一看。我在2016年的GopherCon上做了一个关于汇编器的演讲,这在我毕生追求可移植性的过程中是一个高点。


Go汇编器设计(GopherCon 2016)

我们从C开始做了正确的事情,但最终将编译器翻译为Go,使我们能够将Go所具有的所有优势带到其开发中,包括测试、工具、自动重写、性能分析等。当前的编译器比原始编译器干净得多,并且可以生成更好的代码。但是,当然,这就是自举的工作原理。

请记住,我们的目标不仅仅是一种语言,而是更多。

我们不寻常的做法绝不是对LLVM或语言社区中任何人的侮辱。我们只是使用了最适合我们任务的工具。当然,今天有一个LLVM托管的Go编译器,以及许多其他应该有的编译器。

项目管理

我们从一开始就知道,要成功,Go必须是一个开源项目。但我们也知道,在弄清楚关键的思想和有一个工作的实现之前,私下开发会更高效。头两年对澄清我们在试图实现什么,而不受干扰,是必不可少的。

向开源的转变是一个巨大的改变,也很具教育意义。来自社区的投入是压倒性的。与社区的接触花费了大量的时间和精力,尤其是对Ian,不知怎么他找到时间来回答任何人提出的每一个问题。但它也带来了更多。我仍然惊叹在Alex Brainman的指导下,社区完全独立完成的Windows移植的速度。那很神奇。

我们花了很长时间来理解转向开源项目的影响,以及如何管理它。

特别是,公平地说,我们花了太长时间来理解与社区合作的最佳方式。本次演讲的一个主题是我们的沟通不足——即使我们认为我们正在进行良好沟通——由于误解和不匹配的期望,大量时间被浪费了。本可以做得更好。

但是,随着时间的推移,我们说服了社区中的至少那一部分和我们在一起的人,我们的一些想法,虽然与常见的开源方式不同,但具有价值。最重要的是我们坚持通过强制代码审查和对细节的穷尽关注来维护高质量代码


Mission Control (drawing by Renee French)

一些项目的工作方式不同,它们快速接受代码,然后在提交后进行清理。Go项目则相反,力图将质量放在第一位。我相信这是更有效的方式,但它将更多的工作推回社区,如果他们不理解其价值,他们就不会感到应有的欢迎。在这方面还有很多东西要学习,但我相信现在的情况已经好多了。

顺便说一句,有一个历史细节不是广泛为人知的。该项目使用过4个不同的内容管理系统:SVN、Perforce、Mercurial和Git。Russ Cox做了一份艰巨的工作,保留了所有历史,所以即使今天,Git仓库也包含了在SVN中做出的最早的更改。我们都认为保留历史很有价值,我要感谢他做了这项艰苦的工作。

还有一点。人们经常认为谷歌会告诉Go团队该做什么。这绝对不是真的。谷歌对Go的支持非常慷慨,但它不制定议程。社区的投入要大得多。谷歌内部有一个巨大的Go代码库,团队用它来测试和验证版本,但这是通过从公共仓库导入谷歌完成的,而不是反过来。简而言之,核心Go团队由谷歌支付薪水,但他们是独立的。

包管理

Go的包管理开发过程做得并不好。我相信,语言本身的包设计非常出色,并且在我们讨论的第一年左右的时间里消耗了大量的时间。如果你感兴趣的话,我之前提到的SPLASH演讲详细解释了它为什么会这样工作。

一个关键点是使用纯字符串来指定导入语句中的路径,从而提供了我们正确认为很重要的灵活性。但从只有一个“标准库”到从网络导入代码的转变是坎坷的。


修复云(Renee French 绘制)

有两个问题。

首先,我们这些Go核心团队的成员很早就熟悉Google的工作方式,包括它的monorepo(单一代码仓库)和每个人都在负责构建。但是我们没有足够的经验来使用具有大量包版本的包管理器以及尝试解决依赖关系图的非常困难的问题。直到今天,很少有人真正理解技术的复杂性,但这并不能成为我们未能从一开始就解决这些问题的借口。这尤其令人尴尬,因为我曾是一个失败项目的技术负责人,为谷歌的内部构建做类似的事情,我应该意识到我们面临的是什么。


deps.dev

我在deps.dev上的工作是一种忏悔。

其次,让社区参与帮助解决依赖管理问题的初衷是好的,但当最终设计出来时,即使有大量的文档和有关理论的文章,社区中的许多人仍然感到受到了轻视。


pkg.go.dev

这次失败给团队上了一课,让他们知道如何真正与社区互动,并且自此取得了很大的进步。

不过,现在事情已经解决了,新的设计在技术上非常出色,并且似乎对大多数用户来说效果很好。只是时间太长,而且道路崎岖不平。

文档和示例

我们事先没有得到的另一件事是文档。我们写了很多文档,并认为我们做得很好,但很快就发现社区想要的文档级别与我们的预期不同。


修理图灵机的Gopher(Renee French 绘图)

关键缺失的一部分是最简单函数的示例。我们曾以为只需说明某个东西的功能就足够了,但我们花费了太长时间才接受到展示如何使用它的价值更大。


可执行的例子

不过,我们已经吸取了教训。现在文档中有很多示例,大部分是由开源贡献者提供的。我们很早就做的一件事就是让它们在网络上可执行。我在2012年的Google I/O大会上做了一次演讲,展示了并发的实际应用,Andrew Gerrand 编写了一段可爱的Web goo,使得直接从浏览器运行代码片段成为可能。我怀疑这是第一次这样做,但Go是一种编译语言,很多观众以前从未见过这个技巧。然后该技术被部署到博客和在线包文档中。


Go playground

也许更重要的是我们对Go Playground的支持,这是一个免费的开放沙箱,供人们尝试,甚至开发代码。

结论

我们已经走了很长一段路。

回顾过去,很明显很多事情都做得对,并且它们都帮助Go取得了成功。但还有很多事情可以做得更好,重要的是要承认这些问题并从中学习。对于任何托管重要开源项目的人来说,双方都有教训。

我希望我对这些教训及其原因的历史回顾会有所帮助,也许可以作为对那些反对我们正在做的事情和我们如何做的人的一种道歉/解释。


GopherConAU 2023 吉祥物,作者:Renee French

但在推出 14 年后,我们终于来了。公平地说,总的来说这是一个非常好的地方。

很大程度上是因为通过设计和开发Go作为一种编写软件的方式(而不仅仅是作为一种编程语言)做出的决定,我们已经到达了一个新的地方。

我们到达这里的部分原因包括:

  • 一个强大的标准库,可实现服务器代码所需的大部分基础知识
  • 并发作为该语言的“一等公民”
  • 基于组合而不是继承的方法
  • 澄清依赖管理的打包模型
  • 集成的快速构建和测试工具
  • 严格一致的代码格式
  • 注重可读性而非聪明性
  • 兼容性保证

最重要的是,得益于令人难以置信的乐于助人且多元化的Gophers社区的支持。


多元化的社区(@tenntennen 绘图)

也许这些问题最有趣的结果是,无论是谁编写的Go代码的外观和工作原理都是一样的,基本上没有使用该语言的不同子集的派系,并且保证随着时间的推移代码可继续编译和运行。对于主要编程语言来说,这可能是第一次。

我们绝对做对了。

谢谢。


“Gopher部落”知识星球旨在打造一个精品Go学习和进阶社群!高品质首发Go技术文章,“三天”首发阅读权,每年两期Go语言发展现状分析,每天提前1小时阅读到新鲜的Gopher日报,网课、技术专栏、图书内容前瞻,六小时内必答保证等满足你关于Go语言生态的所有需求!2024年,Gopher部落将进一步聚焦于如何编写雅、地道、可读、可测试的Go代码,关注代码质量并深入理解Go核心技术,并继续加强与星友的互动。欢迎大家加入!

img{512x368}
img{512x368}

img{512x368}
img{512x368}

著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格5$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

Gopher Daily(Gopher每日新闻) – https://gopherdaily.tonybai.com

我的联系方式:

  • 微博(暂不可用):https://weibo.com/bigwhite20xx
  • 微博2:https://weibo.com/u/6484441286
  • 博客:tonybai.com
  • github: https://github.com/bigwhite
  • Gopher Daily归档 – https://github.com/bigwhite/gopherdaily

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

使用Go和WebRTC data channel实现端到端实时通信

本文永久链接 – https://tonybai.com/2023/09/23/p2p-rtc-implementation-with-go-and-webrtc-data-channel

关于实时通信(RTC,Real-Time Communication),我和大多数人一样,是用的多(比如网络电话、音视频会议等),但对RTC概念和其底层技术原理了解的却不多。近期,一项目恰用到了RTC技术,我就顺便翻阅了一些资料,并用Go建立了一个端到端数据通信的小demo,这里给大家分享一下。

1. RTC与WebRTC

1.1 实时通信(Real-Time Communication)

实时通信(RTC)是实时发生的任何在线通信。生活中,最常见的采用实时通信方式的例子就是电话:一旦双方接通后,数据便直接从发送方即时发送到接收方,不会存储在前往目的地的途中

而传统的邮件以及互联网电子邮件则并非实时通信,因为在邮件/电邮的场景下,我们发送数据后,对方通常要等待一段时间才能收到数据,同时我们也需要等待一段时间才能收到回复。相信这个反例可以更好地帮助大家理解实时通信的特点。

总结一下,实时通信具有以下特点(想象一下打电话的过程):

  • 存在接通的过程
  • 点对点(通常没有中间存储或处理节点)
  • 传输低延迟

1.2 WebRTC技术的诞生

显然RTC技术是一种能给人们生活带来极大便捷的技术,尤其是在音视频实时传输方面,但很长时间以来,实时通信技术都十分复杂,还有专利门槛,将实时通信技术与业务结合既非常困难,又十分耗时,并且即便大力投入也未必能取得很好的效果,通常只有大厂才有这个能力实现稍完善的RTC方案和产品。

此外,随着Web技术的兴起、移动互联网时代的到来、4G/5G和宽带技术的蓬勃发展,人们都迫切希望将实时通信技术与Web等技术融合在一起,通过浏览器或智能终端即可快速建立音视频的实时数据通信。

于是2009年谷歌出手了!

  • 2009年,谷歌提出了创建WebRTC的概念,作为Adobe Flash以及无法在浏览器中运行的桌面应用程序的替代方案。
  • 2010年,谷歌收购了大量提供RTC技术授权的公司。
  • 2011年,谷歌开源了WebRTC项目
  • 2011年末,W3C发布第一个WebRTC规范草案。
  • 2013年,谷歌和Mozilla展示了基于WebRTC的异构浏览器之间的视频通话。
  • 2017年,WebRTC进入候选推荐标准(Candidate Recommendation,CR)阶段。
  • 2021年初,WebRTC成为W3C正式推荐标准及IETF标准

如今,WebRTC已经广泛用在了在线教育、电商直播、泛娱乐社交等应用领域。

1.3 WebRTC简明介绍

WebRTC(Web Real-Time Communication)是一套开源的点对点实时通信技术,最初为Web打造,旨在让Web应用可以直接在浏览器中进行实时的音视频通信和数据交换,而无需安装第三方插件。WebRTC具体体现为一组开源协议、引擎和API。

下面是W3C出品的WebRTC的技术栈的架构图(来自https://webrtc.github.io/webrtc-org/architecture/):

我们看到WebRTC还是蛮复杂的,涉及到多类API、会话/信令管理、音频编解码算法引擎、视频编解码算法引擎、包含多种协议的传输层以及底层音视频捕捉和渲染等。全面掌握WebRTC全技术栈是很困难的,好在上面的架构图将不同领域的开发者的关注点做了标记,大多数开发者关注WebRTC API和Web API即可。并且,随着WebRTC自身的演进,目前WebRTC已经不局限于浏览器,可以应用于其他各种应用程序。在Go社区,最知名的WebRTC类项目莫过于pion了,它提供了纯Go的WebRTC API实现,任何Go应用都可以使用pion的WebRTC API开发点对点实时通信应用。

1.4 WebRTC相关的协议

WebRTC并没有全部另立炉灶从头建立很多新协议,而是复用了很多成熟的网络协议和应用协议,尤其是涉及数据传输的协议。下图是WebRTC中使用的一些重要协议分布图:


图改自《WebRTC技术详解》一书

很多协议大家都非常熟悉,比如HTTP、WebSocket、TLS、TCP、UDP等,但也有些协议是大家比较陌生的,如RTP/SRTP、SCTP等,针对这些陌生协议,我们下面简要介绍一下:

1.4.1 RTP(Real-time Transport Protocol,实时传输协议)和SRTP(Secure RTP)

RTP协议支持通过IP网络实时传输音频和视频。RTP常用于流媒体服务的通信系统,例如网络电话、视频电话会议等系统。RTP也是WebRTC使用的最重要的协议之一,在WebRTC中,RTP用于在WebRTC客户端(比如浏览器)之间传输音频和视频媒体(media)数据包。

RTP是专为流媒体的端到端实时传输设计的,更关注信息的实时性,可以避免出现因网络传输丢失数据造成通话质量下降的情况。并且,如上图所示,RTP都是基于UDP构建的,并额外提供抖动补偿、包丢失检测和无序传递检测的功能。

此外,RTP在传递媒体流时会为每个媒体流建立一个会话,即音频和视频流各自使用单独的RTP会话,这样接收端就能有选择性地接收媒体流(音频、视频或音视频)。

基础的RTP没有内置任何安全机制,因此不能保证传输数据的安全性,这样端与端之间通信传输未加密的数据时,都有可能被第三方拦截并窃取。为此,WebRTC规范明确禁止使用未加密的RTP,而是使用安全增强后的SRTP(Secure RTP)。SRTP可以为单播和多播应用程序中的RTP数据提供加密、消息身份验证和完整性以及重放攻击保护等安全功能。

注:对于非音频或视频数据,WebRTC不使用RTP,而是在通信的两端建立一个data channel用于交换任意格式的数据。

1.4.2 SCTP(Stream Control Transmission Protocol,SCTP)

WebRTC的端与端建立连接后,音视频数据的交互由RTP/SRTP协议完成,但非音视频数据,则由两端之间建立的数据通道(data channel)完成。数据通道支持传输字符串、文件、图片等数据。

数据通道API的使用方式与WebSocket非常相似,但是WebSocket运行于TCP之上,而WebRTC数据通道的底层传输使用了DTLS/UDP,具有较高的安全性,上层则是使用SCTP,默认使用可靠且有序的方式进行数据传输。

SCTP是在2000年由IETF的SIGTRAN工作组定义的一个传输层协议。它是面向连接、端到端、全双工、带有流量和拥塞控制的可靠传输协议,本来与TCP和UDP处于同一级别,可以直接运行在IP之上。只是在WebRTC中,它被用在了应用层。

WebRTC充分利用了SCTP的面向消息(非tcp那样的面向流)的、带有拥塞控制算法的可靠传输机制,同时SCTP支持在一个传输通道中关联多个流的特性,这样每个流可以单独处理,甚至可以具有不同的可靠性属性。流与流之间不存在线头阻塞问题。流由流编号标识,可以在一定程度上提供多路复用功能,而无需开多个SCTP连接。

1.4.3 SDP(Session Description Protocol, 会话描述协议)

SDP是一种文本形式的会话描述协议,用于描述多媒体会话的参数。

SDP是WebRTC端与端建立连接过程中必须要使用的协议。WebRTC使用SDP来描述对等连接的两端的媒体特征,包括会话属性、会话活动的时间、会话包含的媒体信息、媒体编/解码器、媒体地址和端口信息以及网络带宽的信息等。

下面是SDP协议内容的一个典型例子(来自https://developer.mozilla.org/en-US/docs/Glossary/SDP):

v=0
o=alice 2890844526 2890844526 IN IP4 host.anywhere.com
s=
c=IN IP4 host.anywhere.com
t=0 0
m=audio 49170 RTP/AVP 0
a=rtpmap:0 PCMU/8000
m=video 51372 RTP/AVP 31
a=rtpmap:31 H261/90000
m=video 53000 RTP/AVP 32
a=rtpmap:32 MPV/90000

WebRTC的两个端在使用RTP/SRTP传输音视频数据或使用SCTP传输data channel数据之前,需要先建立连接。建立连接的过程类似于传统电话从拨号、呼叫等待、到接通的过程。这个过程通常会有一个叫信令服务器(signaling server)的中间角色(好比文首配图的人工电话交换机)参与。而SDP在建连过程中起着重要作用,信令服务器会将两端的SDP转发给另一方,直到两端都拥有了自己和对方的会话描述信息(SDP承载),并在媒体交换格式方面达成了一致,这是两端连接成功的前提。

注:SDP不是WebRTC专属的,SDP在很多领域有广泛应用,最常见的就是即时通信(IM)领域。

1.4.4 STUN、TURN和ICE

使用WebRTC进行实时通信的两端通常都位于防火墙或NAT之后的“内网”,只有很少部分主机能够拥有独立的公网IP而直接接入Internet。也就是说,尝试建立连接的双方由于位于NAT网络之中,不能直接使用内网IP地址建立网络连接。WebRTC于是使用“NAT穿透技术(俗称打洞)”来帮助两端建立连接。

STUN就是一种最常见的NAT穿透协议,其全称是“Simple Traversal of UDP Through NATs”,即简单的用UDP穿透NAT。STUN本质上是一种公网地址及端口的发现协议,客户端向STUN服务器发送请求,STUN服务器返回客户端的公网地址及NAT网络信息。这些信息用于构建在ICE打洞时的候选地址,并由信令服务器转发给另一端。

不过STUN无法应对所有NAT网路情形,在对称NAT(映射的外网地址端口号不固定,会随着目的地址的变化而变化)情况下,WebRTC用户无法使用STUN协议建立P2P连接,这种情况就需要借助TURN协议提供的服务进行流量中转。

TURN(Traversal Using Relays around NAT)是一种通过数据转发的方式穿透NAT的,解决了防火墙和对称NAT的问题。TURN支持UDP和TCP协议。

注:使用STUN建立的是P2P的网络模型,网络连接直接建立在通信两端,没有中间服务器介入;而使用TURN建立的是流量中继的网络模型,用户两端都与TURN服务建立连接,用户的网络数据包通过TURN服务进行转发 — 《WebRTC技术详解》

我们看到,TURN与STUN的共同点都是通过修改应用层中的私网地址达到NAT穿透的效果,不同点是TURN是通过两方通讯的“中间人”方式实现穿透。但TURN与其他中继控制协议也有不同,它能够允许一个客户端使用一个中继地址与多个对端连接。

ICE(Interactive Connectivity Establishment, 交互式连接建立)跟STUN和TURN不一样,ICE不是一种协议,而是一个框架(Framework),它整合了STUN和TURN,并利用STUN和TURN服务器来帮助两端建立起连接。

WebRTC的一端通过ICE获得的每个网络信息都会被包装成一个ICE候选者(candidate)。ICE候选者描述了用于建立网络连接的网络信息,包含网络协议、IP地址、端口等。如果设备上有多个IP地址,那么每个IP地址都会对应一个候选。例如设备A上有内网IP地址IP-1,还有公网IP地址IP-2,A通过IP-1可以直接与B进行通信,但是WebRTC不会判断优先使用哪个IP地址,而是同样从两个IP地址收集候选,并将候选信息通过信令服务器转发给另一端。

ICE候选者有多种类型(以基于UDP传输为例),包括host(本机候选)、srflx(映射候选)、relay(中继候选)和prflx(来自对称NAT的映射候选)。类型有优先级次序,其中host优先级最高,relay优先级最低。比如WebRTC收集到了两个候选者,一个是host类型,另一个是srflx类型,那么WebRTC一定会先尝试与host类型的Candidate建立连接,如果不成功,才会使用srflx类型的Candidate。

当两端都得到自己和对方的ICE候选信息后,就会进行ICE候选配对,并最终选出一个用于建立端与端连接的ICE候选者对(pair),最终两端将基于这个候选者对中的网络信息建立了P2P的连接。

有了上面协议这层铺垫后,接下来我们再来看WebRTC建立连接的流程就容易多了。

1.5 WebRTC的建连流程

下面是WebRTC的典型建连流程图:

如图所示,WebRTC端到端建立连接的第一步是与信令服务器建立连接并交换SDP信息。

信令服务器通常位于两端都能访问到的公网。当WebRTC一端启动后,它可能不知道要与谁通信,或者仅知道对方的极少的信息(比如一个ID),信令服务器可以帮助参与通信的两端解决这个问题。就像前面说的,你可以将信令服务器看作是电话人工交换机及其操作员,它可以帮助参与通信的两端找到彼此。WebRTC并未将信令服务器以及信令协议标准化,因为信令服务器是“业务相关”的,究竟是建立一对一连接,还是建立群聊,这些由信令服务器的业务来决定。承载信令的协议可以是普通的HTTP,也可以是WebSocket,亦可是像XMPP那样的专用信令协议。

在WebRTC中,主动发起连接的一方会创建offer,并通过信令服务器将offer转发给另一方;另一方收到offer后会创建answer,并同样通过信令服务器转发给发起方。无论是offer,还是answer,都包含了各自的SDP信息。

第二步,当交换SDP后,两端各自发起ICE过程,向STUN/TURN服务器发起请求,获取各自NAT后的公网信息,并形成ICE候选者。

第三步,双方通过信令服务器交换ICE候选者信息

当ICE候选者配对成功后,就来到了第四步,WebRTC两端直接建立连接。连接建立成功后,便可以进行数据传输交换了。

2. WebRTC data channel

上面提到过,WebRTC除了提供了音视频媒体实时通信能力外,还支持可以传输非媒体流数据的数据通道(data channel)

和音视频数据一样,经由WebRTC数据通道进行的数据交换不经过服务器,不受服务器性能及带宽瓶颈的限制,同时减少了数据被拦截的概率。数据通道底层传输使用了DTLS,具有较高的安全性。上层使用SCTP,默认使用可靠且有序的方式进行数据传输。此外,data channel的建连过程与音视频的建连过程也是一致的。

下面我们就来用一个实际的例子展示一下如何使用Go建立基于WebRTC data channel的端到端实时通信。

3. 基于Go和Pion的WebRTC data channel应用示例

通过前面的介绍,我们知道了WebRTC技术栈十分复杂,日常WebRTC应用开发时,我们一般会基于开源的实现进行开发。Go语言在WebRTC开发领域也有比较成熟的开源项目,如Pion。Pion提供了纯Go实现的WebRTC API实现以及WebRTC相关组件实现,使用Pion可以帮助我们快速高效开发WebRTC服务器和客户端应用。

3.1 pion: 纯Go的WebRTC实现

根据pion之父的说法,pion的诞生源于用WebRTC构建东西的挫败感,这种挫败感来源于Google开源的首个webrtc实现libwebrtc,因为将libwebrtc构建和运行起来似乎十分困难。

pion就是根据libwebrtc的教训而设计的,pion给开发者的第一印象就是它十分容易构建和运行起来。这一定程度要归功于pion是用Go编写的,更模块化,也更透明,并且pion之父最初便考虑了将其用在Chromium之外的应用中。

pion是一个纯粹的WebRTC软件的Go集合, 涵盖了WebRTC项目中需要的所有主要元素:

同时,pion项目还为WebRTC开发者贡献了一本非常好的WebRTC资料《WebRTC For The Curious》,很值得一读。另外,pion项目的examples也十分丰富,非常利于初学者快速掌握WebRTC以及如何使用pion开发WebRTC应用。

下面我们就基于pion的webrtc实现项目开发一个基于data channel的端到端实时通信示例。

根据之前对WebRTC建立过程的说明,我们首先需要设计一下这个示例的信令服务器以及信令协议。

3.2 信令服务与协议设计

信令服务器在WebRTC通信中扮演协调者的角色。它传递客户端的媒体参数和连接候选信息。

我们的业务模型是,信令服务器维护一个被动连接的peer集合,这个集合中的peer是在这些peer在启动时通过register信令注册到信令服务器中的,每个peer有一个唯一的ID,我称这个集合为answer peer集合吧。主动连接方(这里称为offer peer)则通过ID去连接answer peer。一旦建立与某个peer的连接后,它们便可以通过建立的data channel全双工的实时通信了。下面是信令服务与offer peer和answer peer的信令交互图:

参照前面提到的WebRTC建连过程,你可以很容易的看懂这个协议设计。

这里我设计了一个Message抽象来表示信令服务可以收发的消息:

//webrtc-data-channel/signaling/proto/proto.go

type Message struct {
    Cmd     int    `json:"command"`
    Payload []byte `json:"payload"` // carry all kinds of request and response
}

其中的Cmd字段标识Message类型,可选值如下:

//webrtc-data-channel/signaling/proto/proto.go

const (
    // originated from answer peer
    CmdInit = iota + 1
    CmdAnswer

    // originated from answer peer
    CmdOffer

    // from both peer
    CmdCandidate
)

const (
    CmdInitResp = iota + 101 // CmdInit + 100
    CmdAnswerResp
    CmdOfferResp
    CmdCandidateResp
)

Message既可以承载Request,亦可以承载Response。Message的Payload字段中存放的是Request或Response序列化后的结果。Request和Response结构如下:

//webrtc-data-channel/signaling/proto/proto.go

// Request is one kind of payload for Message
type Request struct {
    SourceID string `json:"source"`
    TargetID string `json:"target"`
    Body     []byte `json:"body"` // carry register, offer, answer, candidate
}

// Request is another payload for Message
type Response struct {
    Code int    `json:"code"`
    Msg  string `json:"msg"`
}

Request类型的Body中存放的是WebRTC Offer/Answer的SDP以及ICE Candidate序列化后的结果。

此外,在这个示例中,我们使用WebSocket来作为信令协议的载体,便于信令服务器与offer peer/answer peer进行双向通信。

3.3 信令服务器的实现

按照上述设计,我们的信令服务器就是一个websocket的server:

//webrtc-data-channel/signaling/main.go

func main() {
    flag.Parse()
    log.SetFlags(log.Ldate | log.Ltime | log.Lmicroseconds)
    http.HandleFunc("/register", register) // for peerAnswer
    http.HandleFunc("/offer", offer)       // for peerOffer
    log.Fatal(http.ListenAndServe(*addr, nil))
}

在这个server中我们提供了两个endpoint,一个是/register,供answer peer建立连接使用;另外一个是/offer,供offer peer与信令服务器建连并通信的。

两个endpoint对应的Handler的处理模式也相对一致,都是进入一个event loop中。

//webrtc-data-channel/signaling/main.go

func register(w http.ResponseWriter, r *http.Request) {
    c, err := upgrader.Upgrade(w, r, nil) // *websocket.Conn
    if err != nil {
        log.Print("signaling: websocket upgrade error:", err)
        return
    }
    defer c.Close()

    err = answerPeerEventLoop(c, w)
    if err != nil {
        log.Println("signaling: answerPeerEventLoop error:", err)
        return
    }
    log.Println("signaling: answerPeerEventLoop exit")
}

func offer(w http.ResponseWriter, r *http.Request) {
    c, err := upgrader.Upgrade(w, r, nil) // *websocket.Conn
    if err != nil {
        log.Print("signaling: websocket upgrade error:", err)
        return
    }
    defer c.Close()

    err = offerPeerEventLoop(c, w)
    if err != nil {
        log.Println("signaling: offerPeerEventLoop error:", err)
        return
    }
    log.Println("signaling: offerPeerEventLoop exit")
}

注:offer和register这两个Handler都会在单独的goroutine中执行。

offerPeerEventLoop和answerPeerEventLoop的代码都比较长,这里就不贴出来了。这两个函数的代码也都比较模式化,基本处理流程就是读取一个Message,判断Message的Cmd类型,然后根据Cmd类型分别处理,处理的逻辑参见上面信令服务器的信令处理流程:基本上就是转发、转发、转发。

3.4. answer peer的实现

answer peer启动后会建立RTCPeerConnection类型实例,并设置RTCPeerConnection实例的事件处理函数:

  • OnICECandidate

本地收集到ICE候选者信息,处理动作是将这些ICE候选者信息通过信令服务转发到对端。

  • OnConnectionStateChange

当与对端的连接状态发生变化时触发,比如连接建立、连接断开时。处理动作仅为输出相应的日志。

  • OnDataChannel

当与对端的Data Channel创建成功时,处理逻辑是注册DataChannel.OnOpen和DataChannel.OnMessage两个事件处理函数。

完成这些后,answer peer会向上面设计的那样,与信令服务器建立连接,并发送请求到信令服务的/register端点,然后进入event loop。在event loop中负责处理信令服务器转发过来的Offer、Candidate等信息,以及各种信令服务器返回的Response。

当收到Offer时,answer peer会创建Answer并发给信令服务器;当收到Candidate时,会调用AddICECandidate将Candidate信息添加到peerConnection中,供后续配对使用。后续WebRTC连接自动建立后,便可以通过data channel收发数据了。

answer peer的代码较长,大家可以自行到https://github.com/bigwhite/experiments/tree/master/webrtc-data-channel/answer阅读。

注:answer peer的代码改编自pion/webrtc项目pion-to-pion/answer示例

3.5. offer peer的实现

offer peer的实现与answer相似。

offer peer启动后会建立RTCPeerConnection类型实例,并设置RTCPeerConnection实例的事件处理函数:

  • OnICECandidate
  • OnConnectionStateChange
  • DataChannel的OnOpen
  • DataChannel的OnMessage

offer peer会主动创建DataChannel,然后与信令服务器建立连接,并发送请求到信令服务的/offer端点并主动向信令服务器发送Offer,最后进入event loop。在event loop中负责处理信令服务器转发过来的Answer、Candidate等信息,以及各种信令服务器返回的Response。

当收到Answer时,offer peer会将Answer中携带的SDP传给SetRemoteDescription,同时调用SetLocalDescription开启ICE候选者的收集过程;当收到Candidate时,会调用AddICECandidate将Candidate信息添加到peerConnection中,供后续配对使用。后续WebRTC连接自动建立后,便可以通过data channel收发数据了。

offer peer的代码较长,大家可以自行到https://github.com/bigwhite/experiments/tree/master/webrtc-data-channel/offer阅读。

注:offer peer的代码改编自pion/webrtc项目pion-to-pion/offer示例

3.6 运行示例

下面我们来运行一下这个示例。

先来启动信令服务器:

$cd webrtc-data-channel/signaling
$go run main.go

启动answer peer:

$cd webrtc-data-channel/answer
$go run main.go
2023/09/23 21:24:45.201213 answer: NewPeerConnection ok
2023/09/23 21:24:45.201256 answer: connecting to ws://localhost:18080/register
2023/09/23 21:24:45.203993 answer: recv resp[101]: proto.Response{Code:0, Msg:"ok"}

这时我们会从信令服务器的输出日志中看到:

2023/09/23 21:24:45.203702 signaling: add answer peer: answer-peer-1

我们看到,answer peer成功注册到信令服务器中了,其ID为answer-peer-1。

下面我们来启动offer peer,其要连接的target为answer-peer-1:

$cd webrtc-data-channel/offer
$go run main.go -target answer-peer-1
2023/09/23 21:25:26.462845 offer: new peerConnection ok
2023/09/23 21:25:26.462880 offer: create new channel
2023/09/23 21:25:26.462890 offer: connecting to ws://localhost:18080/offer
2023/09/23 21:25:26.464863 offer: create offer
2023/09/23 21:25:26.465131 offer: recv resp[103]: proto.Response{Code:0, Msg:"ok"}
2023/09/23 21:25:26.465957 offer: recv answer(sdp) message from answer-peer-1
2023/09/23 21:25:26.466064 offer: set local desc
2023/09/23 21:25:26.466099 offer: set remote desc
2023/09/23 21:25:26.466201 offer: Peer Connection State has changed: connecting
2023/09/23 21:25:26.466297 offer: recv candidate message from answer-peer-1
2023/09/23 21:25:26.466344 offer: invoke peerConnection.OnICECandidate: webrtc.ICECandidate{statsID:"candidate:KsXlIk2JNeiDqK3l+znsoB3sDwuh1/2x", Foundation:"4104056053", Priority:0x7effffff, Address:"192.168.1.105", Protocol:1, Port:0xc2b1, Typ:1, Component:0x1, RelatedAddress:"", RelatedPort:0x0, TCPType:""}
2023/09/23 21:25:26.466506 offer: recv resp[104]: proto.Response{Code:0, Msg:"ok"}
2023/09/23 21:25:26.468342 offer: Peer Connection State has changed: connected
2023/09/23 21:25:26.469105 offer: Data channel 'data'-'824634439080' open. Random messages will now be sent to any connected DataChannels every 5 seconds
2023/09/23 21:25:26.859774 offer: recv candidate message from answer-peer-1
2023/09/23 21:25:31.469811 offer: Sending 'offer-1013426535'
2023/09/23 21:25:31.470846 offer: Message from DataChannel 'data': 'answer-695102175'
2023/09/23 21:25:36.469653 offer: Sending 'offer-2065047193'
2023/09/23 21:25:36.470495 offer: Message from DataChannel 'data': 'answer-750781464'
2023/09/23 21:25:41.469603 offer: Sending 'offer-153497802'
2023/09/23 21:25:41.469938 offer: Message from DataChannel 'data': 'answer-2102723687'
2023/09/23 21:25:46.469504 offer: Sending 'offer-1287609150'
2023/09/23 21:25:46.470097 offer: Message from DataChannel 'data': 'answer-645051512'
2023/09/23 21:25:51.470078 offer: Sending 'offer-1486812657'
2023/09/23 21:25:51.470572 offer: Message from DataChannel 'data': 'answer-1325372035'

offer peer的启动引发了“连锁反应”,在信令服务器的帮助下,offer peer与answer peer成功建立了连接,并在打开的Data Channel进行着“定时”的双工实时通信。

信令服务器的输出日志如下:

2023/09/23 21:25:26.465049 signaling: recv request[3] from offer peer
2023/09/23 21:25:26.465070 signaling: send offer resp ok
2023/09/23 21:25:26.465073 signaling: add offer peer:  offer-peer-1
2023/09/23 21:25:26.465085 signaling: forward request[3] to answer peer ok
2023/09/23 21:25:26.465247 signaling: recv offer response from answer peer
2023/09/23 21:25:26.465868 signaling: recv request[2] from answer peer
2023/09/23 21:25:26.465896 signaling: forward request[2] to offer peer[offer-peer-1] ok
2023/09/23 21:25:26.466003 signaling: recv answer response from offer peer
2023/09/23 21:25:26.466218 signaling: recv request[4] from answer peer
2023/09/23 21:25:26.466245 signaling: forward request[4] to offer peer[offer-peer-1] ok
2023/09/23 21:25:26.466363 signaling: recv candidate response from offer peer
2023/09/23 21:25:26.466415 signaling: recv request[4] from offer peer
2023/09/23 21:25:26.466429 signaling: send offer resp ok
2023/09/23 21:25:26.466435 signaling: add offer peer:  offer-peer-1
2023/09/23 21:25:26.466445 signaling: forward request[4] to answer peer ok
2023/09/23 21:25:26.466526 signaling: recv candidate response from answer peer
2023/09/23 21:25:26.859520 signaling: recv request[4] from answer peer
2023/09/23 21:25:26.859609 signaling: forward request[4] to offer peer[offer-peer-1] ok
2023/09/23 21:25:26.859951 signaling: recv candidate response from offer peer

answer peer的输出日志如下:

2023/09/23 21:25:26.465182 answer: recv offer message from offer-peer-1
2023/09/23 21:25:26.465823 answer: send sdp answer
2023/09/23 21:25:26.465834 answer: Peer Connection State has changed: connecting
2023/09/23 21:25:26.465925 answer: set local desc
2023/09/23 21:25:26.465928 answer: recv resp[102]: proto.Response{Code:0, Msg:"ok"}
2023/09/23 21:25:26.466108 answer: invoke peerConnection.OnICECandidate: 192.168.1.105
2023/09/23 21:25:26.466285 answer: recv resp[104]: proto.Response{Code:0, Msg:"ok"}
2023/09/23 21:25:26.466481 answer: recv candidate message from offer-peer-1
2023/09/23 21:25:26.468475 answer: Peer Connection State has changed: connected
2023/09/23 21:25:26.469002 answer: New DataChannel data 824634440046
2023/09/23 21:25:26.469049 answer: Data channel 'data'-'824634440046' open. Random messages will now be sent to any connected DataChannels every 5 seconds
2023/09/23 21:25:26.859199 answer: invoke peerConnection.OnICECandidate: 175.160.224.151
2023/09/23 21:25:26.859770 answer: recv resp[104]: proto.Response{Code:0, Msg:"ok"}
2023/09/23 21:25:31.470331 answer: Sending 'answer-695102175'
2023/09/23 21:25:31.470366 answer: message from DataChannel 'data': 'offer-1013426535'
2023/09/23 21:25:36.470028 answer: Sending 'answer-750781464'
2023/09/23 21:25:36.470123 answer: message from DataChannel 'data': 'offer-2065047193'
2023/09/23 21:25:41.469624 answer: Sending 'answer-2102723687'
2023/09/23 21:25:41.469978 answer: message from DataChannel 'data': 'offer-153497802'
2023/09/23 21:25:46.469606 answer: Sending 'answer-645051512'
2023/09/23 21:25:46.469883 answer: message from DataChannel 'data': 'offer-1287609150'
2023/09/23 21:25:51.470303 answer: Sending 'answer-1325372035'
2023/09/23 21:25:51.470421 answer: message from DataChannel 'data': 'offer-1486812657'

这次运行是在本地同一主机下运行的。你也可以将信令服务器搭建在公网主机上,然后将answer peer和offer peer分别放到不同的公有云虚机上,你看看是否依然可以连通!我在阿里云上的测试结果是ok的(信令服务器放在美国)。

注:示例中使用的stun server:74.125.137.127:19302实际上就是stun.l.google.com:19302。

4. 小结

通过本文的讲解和示例,我们看到:基于WebRTC数据通道可以实现低延迟的P2P实时通信。Go语言通过Pion等项目库提供了对开发WebRTC的支持。通过信令服务器协调Offer/Answer模型,可以建立起端到端的数据通道。未来WebRTC数据通道可用于更多像实时协同、远程控制等应用场景。

本文代码示例可在这里下载。

注:本文示例仅是用作展示如何使用Go进行WebRTC应用的开发,对异常处理等方面并未做太多考虑,不要将示例代码用作生产环境。另外gorilla的websocket.Conn并非始终是goroutine safe的,示例中代码对websocket.Conn的保护并不那么充分。

5. 参考资料


“Gopher部落”知识星球旨在打造一个精品Go学习和进阶社群!高品质首发Go技术文章,“三天”首发阅读权,每年两期Go语言发展现状分析,每天提前1小时阅读到新鲜的Gopher日报,网课、技术专栏、图书内容前瞻,六小时内必答保证等满足你关于Go语言生态的所有需求!2023年,Gopher部落将进一步聚焦于如何编写雅、地道、可读、可测试的Go代码,关注代码质量并深入理解Go核心技术,并继续加强与星友的互动。欢迎大家加入!

img{512x368}
img{512x368}

img{512x368}
img{512x368}

著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格5$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

Gopher Daily(Gopher每日新闻) – https://gopherdaily.tonybai.com

我的联系方式:

  • 微博(暂不可用):https://weibo.com/bigwhite20xx
  • 微博2:https://weibo.com/u/6484441286
  • 博客:tonybai.com
  • github: https://github.com/bigwhite
  • Gopher Daily归档 – https://github.com/bigwhite/gopherdaily

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言精进之路1 Go语言精进之路2 商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats