Google - Tony Bai

标签 Google 下的文章

Go考古：创始人亲述Go语言的“创世纪”

七月 3, 2025
0 条评论

本文永久链接 – https://tonybai.com/2025/07/03/meet-the-go-team-2012

大家好，我是Tony Bai。

2012 年，Google I/O 大会的舞台上，一个刚刚发布 1.0 版本的编程语言团队，正襟危坐。他们面对着全球开发者的审视和提问，这其中，就有三位图灵奖得主级别的传奇人物：Ken Thompson、Rob Pike 和 Robert Griesemer。

那一年，Go 1.0 的发布，是一个历史性的里程碑。它意味着一个承诺“向后兼容、稳定可靠”的 Go 语言，正式诞生。

今天，就让我们扮演一次“Go 语言考古学家”，拂去时间的尘埃，回到那个被称为“创世纪”的时刻，重温 Go Team 核心成员们的亲口讲述，探寻这门语言最纯粹的初心和设计哲学。

我们为何创造 Go？—— “厌倦了等待 C++ 编译”

在访谈中，当被问及创造 Go 的初衷时，Rob Pike 给出了一个近乎“玩笑”却又无比真实的答案：

“我们厌倦了等待 C++ 的编译。”

他生动地描绘了当时在 Google 内部的日常：为了构建一个巨大的 C++ 二进制文件，团队成员不得不在庞大的计算集群上等待超过一个小时。

更令人抓狂的是失控的依赖管理。Rob Pike 提到，他的同事 Mike Burrows（Chubby 的作者）在一次漫长的编译中发现，一个他从未听说过的、与项目毫无关系的头文件，竟然被重复编译了 37,000 次！

“当你用 ifdef 宏来保护依赖时，你最终得到的就是一个极其稠密的、做了太多无用功的依赖之巢。” Rob Pike 总结道。

这个巨大的痛点，催生了 Go 最核心的设计目标之一：从语言层面，彻底解决依赖问题。

清晰的依赖图： Go 的导入路径直接明了。
拒绝无用功： 编译器会拒绝未被使用的导入。
高效的编译链： 设计上保证了“编译包 A 不应再重新编译包 C（如果 A->B->C）”。一旦包 B 被编译，它就携带了关于 C 的所有必要信息。

而对于另一位创始人、C 语言和 Unix 的共同发明者 Ken Thompson 来说，促使他下定决心的“临门一脚”则更为直接和幽默。当被问及为何对 Go 如此热情时，他言简意赅：

“当我试图去读 C++0x（即 C++11）的标准草案时，我就下定决心了。”

全场爆笑。在一门日趋复杂的巨型语言面前，三位大师不约而同地选择了回归简单。

Go 的“魔法”时刻 —— 那些改变编程方式的设计

Go 的简洁并非简陋。在这次访谈中，创始人们也分享了那些让他们自己都感到惊喜和自豪的“魔法”设计。

Slices (切片)：Ken Thompson 的神来之笔

Rob Pike 回忆道，团队曾为了“数组”到底该如何工作而苦恼了整整一年。他们既想要静态检查的固定长度数组，又渴望某种形式的可变长度数组。在无数次的挣扎后，有一天，Ken Thompson 带着 slice 的想法走进办公室。

“起初我们并不确定这是不是正确答案，” Rob Pike 说，“但一旦我们开始使用它，一切都变得显而易见。” 一个简单而优雅的设计，完美地解决了这个旷日持久的难题。

Interfaces (接口)：Rob Pike 的挚爱

对于 Rob Pike 而言，接口是他认为 Go 中最强大的特性。

“接口深刻地改变了我对软件开发的思考方式。一个程序由这些可以轻松‘粘合’在一起的东西组成，这种感觉太棒了。它改变了软件被构建的方式。”

Go 的接口是隐式实现的。这种非侵入式的设计，让组件之间的耦合度降至最低，极大地促进了代码的解耦和可组合性。

Packages (包)：看似显然，实则艰难

今天我们觉得理所当然的 Go 包机制——一个包可以由多个文件组成，包内全局变量可以任意顺序声明——在当时也是经过了无数次辩论才最终成型的。

“它看起来似乎是显而易见的，但要弄清楚这一点真的非常困难。” Rob Pike 感叹道。这种“松散”的包设计，极大地简化了代码组织和重构的难度。

有所为，有所不为 —— Go 的设计权衡

当被问及如何看待 D 语言等其他试图改进 C++ 的语言时，Robert Griesemer 阐述了 Go 截然不同的设计哲学：

“我的印象是，D 语言会像 C++ 一样不断成长。而在 Go 中，我们试图采取完全相反的方式：尽可能地移除东西，将其简化到骨架，只保留你构建一切所需的绝对最小值。”

他相信，如果这些小组件是正交且能良好协作的，最终得到的东西会比拥有大量相互掣肘的特性的语言更强大。

这种“少即是多”的哲学，体现在 Go 对许多“流行特性”的刻意“缺失”上。当被问及“最庆幸 Go 缺失了什么特性”时，团队成员提到了：

类型继承体系 (Type Hierarchy)
可选参数 (Optional Arguments)
列表推导式 (List Comprehensions)
三元运算符

Rob Pike 指出，在 Java 或 C++ 中，你通常从设计类型继承树开始。这项工作耗时耗力，一旦发现设计有误，回头修改的成本极高。Go 通过移除类型继承，让程序在演进过程中更易于调整和适应。

为了凸显 Go 的简洁与 C++ 的复杂之间的对比，Rob Pike 更是转述了当时未能到场的 Russ Cox 的一句玩笑话，它为 Go 的哲学做了最好的注脚：
“C++ 的风格指南里条条框框，而 Go 的风格指南第一句或许应该是：你可以使用这门语言的全部。”

回望 2012 的“预言” —— 那些已实现和仍在路上的事

考古的乐趣，在于用今天的视角去审视昨天的预言。在 2012 年，Go Team 对未来的展望，如今看来既有惊人的远见，也留下了些许历史的印记。

对 Go 1.1 的精准预言： 他们当时预测 1.1 版本将专注于性能提升、GC 改进、调度器优化和对更多操作系统的支持。这与后来 Go 1.x 系列的演进路径完全吻合。
对 Go 2.0 的务实态度： 团队明确表示“Go 2 遥遥无期”，Go 2 的新想法将来自于使用 Go 1 中发现的真实需求。这个务实的态度至今仍在指导着 Go 的发展。
最大的“失误”？ 当被问及此，团队坦诚地提到了 nil 指针（Tony Hoare 的“十亿美元的错误”），以及循环变量的作用域问题。这些话题，至今仍在社区中被热烈讨论。
未解的难题与渴望： Rob Pike 当时多次提到，他们非常想实现但还没找到完美方案的“网络化的 Channel (netchan)”，以及对一个真正的“抢占式调度器”的渴望。这些难题，在后来的岁月里，通过不同的方式被逐步探索和解决。

小结：回到源头，理解初心

穿越时空，回到 Go 语言的“创世纪”现场，我们听到的不是高深莫测的理论，而是一群务实的工程师，为了解决自己在日常工作中遇到的真实、具体的痛点，而进行的一场充满智慧、权衡与热情的创造。

他们对简洁的极致追求，对工程效率的深刻理解，以及对“少即是多”的坚定信念，共同塑造了今天我们所热爱的 Go 语言。

理解这段历史，就是理解 Go 的灵魂。

参考资料链接：https://www.youtube.com/watch?v=sln-gJaURzk

你的Go技能，是否也卡在了“熟练”到“精通”的瓶颈期？

想写出更地道、更健壮的Go代码，却总在细节上踩坑？
渴望提升软件设计能力，驾驭复杂Go项目却缺乏章法？
想打造生产级的Go服务，却在工程化实践中屡屡受挫？

继《Go语言第一课》后，我的《Go语言进阶课》终于在极客时间与大家见面了！

我的全新极客时间专栏《Tony Bai·Go语言进阶课》就是为这样的你量身打造！30+讲硬核内容，带你夯实语法认知，提升设计思维，锻造工程实践能力，更有实战项目串讲。

目标只有一个：助你完成从“Go熟练工”到“Go专家”的蜕变！现在就加入，让你的Go技能再上一个新台阶！

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求，请扫描下方公众号二维码，与我私信联系。

GCP大面积故障，Go语言是“元凶”还是“背锅侠”？

六月 16, 2025
0 条评论

本文永久链接 – https://tonybai.com/2025/06/16/go-avoid-critical-incident

大家好，我是Tony Bai。

科技圈的每一次“风吹草动”，尤其是大型云服务的故障，总能引发我们技术人无数的讨论与反思。最近，一则关于“Google Cloud Platform (GCP) Service Control 在 2025 年 6 月发生重大故障”的消息，及其事后分析报告中直指的“null pointer crash loop”，在技术社区掀起了不小的波澜。

故障报告中还提到了几个雪上加霜的因素：没有特性标志 (Feature Flags) 进行高风险部署、缺乏优雅的错误处理（二进制文件直接崩溃而非优雅降级）、以及没有回退机制导致系统过载。

考虑到 Go 语言在 Google 内部（如 Kubernetes, Cloud Run 等）以及整个云原生领域的广泛应用，一个自然而然的疑问浮出水面：Go语言是否是这次 GCP 故障的“元凶”？或者说，Go 的某些特性，是否在某种程度上“助长”了这类问题的发生？反过来，Go 的设计又是否本可以帮助避免这样的灾难？

这这篇文章中，我们就结合社区的智慧，从Go语言特性和更广泛的软件工程实践角度，来剖析一下这类故障背后的深层原因。这不仅是对一个故障的假想复盘，更是对我们日常开发实践的一次警醒。

Go 语言特性：是“防火墙”还是“导火索”？

社区论坛上的讨论，首先就聚焦在了 Go 语言本身的一些特性上。

显式错误返回 (if err != nil)：万无一失还是“防君子不防小人”？

有开发者认为，Go 标志性的显式错误返回设计（即函数返回 (value, error)，调用者必须检查 err），本应是避免错误的有力武器。但也有观点指出，这种模式的“简洁性”（或者说，可以通过 _ 忽略错误的便利性）有时反而可能在项目压力大、追求快速上线时，被开发者有意或无意地跳过，导致潜在的错误处理缺失。比如常见的 value, _ := someFunction() 写法。

Go的显式错误返回，确实为构建健壮软件提供了坚实的基础。它将错误视为一等公民，迫使开发者直面错误处理。但语言提供的机制，终究不能替代开发者的责任心和良好的编码习惯。正如有些开发者提到的，golangci-lint 这样的静态检查工具可以有效地发现未检查的错误，但这需要团队将其融入开发流程并严格执行。**语言设计提供了“防火墙”，但工程师的素养和流程的完备性，才是决定防火墙是否真正起作用的关键。

Nil Pointer Panic：Go 也难逃的“魔爪”？

针对报告中提到的“null pointer crash loop”，许多评论者指出，nil 指针 panic 在 Go 中也并非罕见。Go 语言本身允许指针存在，也允许指针为 nil，并且不像 Rust 的 Option/Result 类型或 C# 的可空引用类型那样，在语言层面强制开发者处理潜在的 nil 情况。

的确，Go 语言的设计哲学是简洁，它相信开发者有能力正确处理指针。避免 nil panic 的核心在于良好的编码实践：防御性编程（在使用指针前进行检查）、最小化指针使用（Go 鼓励值传递，许多场景可以完全避免指针）、以及充分的测试（特别是边界条件和异常路径）。虽然 Go 没有语言层面的强制 nil 检查，但其简洁性也使得这类检查的成本相对较低。

panic/recover 机制：救命稻草还是饮鸩止渴？

有开发者分享经验，倾向于用 panic/recover 包裹所有核心逻辑，试图捕获所有潜在的运行时崩溃。但针对像故障中提到的 Service Control 这样的有状态、高关键性的系统，这种做法也引发了质疑：recover 后的程序状态是否真的可靠？强行“续命”一个可能已处于不一致状态的进程，是否比让它快速失败并由外部监控系统（如 Kubernetes）重启更安全？关于这个问题，我曾在《“这代码迟早出事！”——复盘线上问题：六个让你头痛的Go编码坏味道》一文中也讨论过。

panic/recover 在 Go 中有其特定的适用场景，例如在库的边界将内部的 panic 转换为 error 返回给调用者，或者处理真正意外且难以通过常规错误处理覆盖的严重问题。但对于关键业务服务，尤其是有状态的服务，“fail fast” 依然是目前社区认为的更可取的设计。让服务在遇到严重内部错误时快速、干净地退出，依赖外部的健康检查和自动重启机制来恢复服务，往往比试图在不确定的状态下继续运行更稳妥。

这样来看，Go 语言的设计，如显式错误处理，确实为构建可靠系统提供了工具。但它并不提供“银弹”，也不能完全消除诸如 nil 指针解引用这类逻辑错误的可能性。语言特性是基础，但绝非全部。

超越语言：流程、测试与工程文化的“灵魂拷问”

在针对该故障的讨论中，一个压倒性的共识是：这类大型系统故障，往往更多是软件工程流程、测试策略和工程文化上的问题，而非单一语言设计所能左右。

“100% 测试覆盖率”的迷思与测试策略的缺位

有开发者提出“你可以覆盖 100% 的代码行，但你永远无法覆盖 100% 的输入和状态组合。” 这句话一针见血。过度迷信行覆盖率，而忽略了测试的深度和广度，是许多团队的通病。

那么真正有效的测试策略应该是什么呢？显然单一的测试策略是无法保证程序上线后的质量的。下面是几种常见的测试策略：

单元测试 (Unit Testing): 验证开发者对代码单元在预期输入下的行为。
模糊测试 (Fuzz Testing): 通过自动生成大量随机或变异输入，探索代码的边缘情况和未知缺陷。Go 1.18 已将 Fuzz Testing 内置到标准工具链中，这是一个强大的武器。
集成测试 (Integration Testing): 验证模块间的交互。
端到端测试 (End-to-End Testing): 模拟真实用户场景。
生产测试/灰度发布 (Staged Rollouts / Canary Releases): 在真实生产环境中，小范围、逐步地验证变更的可靠性，这是大型系统发布的“金丝雀”。

这些策略显而易见，但又有多少团队能真正全面的做到呢？

特性标志 (Feature Flags)：高风险变更的“安全阀”

故障报告中提到了“没有特性标志进行风险部署”，这几乎是大型系统发布的“大忌”。特性标志允许团队在不重新部署代码的情况下，动态地开启或关闭某项功能，从而：

安全地进行 A/B 测试。
逐步向用户灰度上线新功能，控制风险。
在出现问题时，能够快速关闭故障功能，实现秒级“回滚”（功能层面）。

缺乏特性标志，意味着任何高风险的变更都像是在“裸奔”。

优雅降级与回滚预案：Plan B 的重要性

系统出错在所难免，关键在于出错后如何表现。故障报告中“二进制崩溃而非优雅降级”以及“没有随机回退导致过载”，都指向了系统鲁棒性的缺失。

优雅降级: 当核心服务出现问题时，非关键功能是否可以降级服务，保证核心可用性？例如，推荐系统不可用时，是否可以展示默认热门内容，而不是整个页面崩溃？
回滚计划: 任何部署都应该有明确、经过演练的回滚计划。出现问题时，能否快速、安全地回退到上一个稳定版本？

代码审查、自动化工具与工程文化

严格的代码审查: 是发现逻辑错误、不规范写法（如忽略错误、滥用指针）的重要手段。
静态分析与 Linter：golangci-lint 等工具可以自动化地检查出大量潜在问题，包括未处理的错误、不安全的并发操作等。但正如有些开发者在评论中所言，“linters can be disabled”，关键还是在于流程的执行。
警惕“Vibe Coding”：有开发者犀利地指出“Garbage in, garbage out”。如果团队强依赖AI的“氛围”编码，而缺乏对生成代码的审查，那么无论用什么语言，都可能埋下隐患。
重视流程而非迷信工具：许多评论都强调，即使有再好的语言特性或工具，如果缺乏健全的开发、测试、部署流程，以及对质量负责的工程文化，故障依然难以避免。

AI 辅助编程：是“帮手”还是新的“风险源”？

一个有趣的衍生讨论是关于 AI 辅助编程（如 GitHub Copilot、Google Gemini Code Assist）在其中的角色。

有开发者提到，Google 内部已有大量代码由 Gemini 生成。也有人分享使用 AI 辅助编程的体验，认为其在作为“结对编程伙伴”或“辅助搜索”时有价值，但完全自动生成的代码质量参差不齐，有时甚至会引入“幻觉”和新的 bug。

AI 辅助编程无疑是未来的趋势，它有可能提高开发效率，辅助开发者处理重复性工作。但目前来看，AI 生成的代码更需要、而不是更不需要人类的严格审查和充分测试。将 AI 视为一个能提供建议、加速编码的助手是合适的，但如果过度依赖，甚至将其生成的代码不经审视直接合入生产，那无异于引入了新的、更不可控的风险源。特别是在错误处理、并发安全、边界条件这些需要深度思考的领域，AI至少目前还难以完全替代经验丰富的工程师，尤其是一些mission critical的系统中。不要被那些用AI生成一个简单工具站的“AI战果”所迷惑。

小节：语言是利器，工程实践才是灵魂

回到最初的问题：GCP Service Control 的这次故障，Go 语言是“元凶”还是“背锅侠”？

从社区的讨论和我们的分析来看，将板子完全打在 Go 语言身上，显然是有失公允的。Go 语言的设计，如其显式错误处理、简洁性带来的高可读性、以及强大的并发能力，都为构建健壮、高效的系统提供了良好的基础。

然而，语言终究只是工具，它不能替代健全的软件工程流程和严谨的工程文化。 此次 GCP 故障所暴露出的问题——无论是可能的 nil 指针解引用，还是更宏观的缺乏特性标志、部署策略失当、错误处理不优雅——更多地指向了在测试、部署、风险控制、质量保障等一系列工程实践环节可能存在的缺失。

对于我们 Go 开发者而言，这次事件给我们带来的启示应该是：

充分利用 Go 的优势： 写出符合 Go 惯例的、清晰的错误处理逻辑；审慎使用指针，做好 nil 检查；发挥 Go 并发模型的威力。
拥抱并严格执行工程最佳实践： 将单元测试、集成测试、模糊测试落到实处；在重要变更上线时，务必使用特性标志和灰度发布策略；建立严格的代码审查机制；利用好静态分析工具。
对 AI 保持理性： 善用 AI 辅助工具提高效率，但绝不能放松对代码质量的把控和人工审查的力度。

最终，构建一个真正高可用、高可靠的大型系统，依赖的绝不仅仅是选择一门“好”的语言，更在于整个团队对卓越工程实践的持续追求和严格执行。

你对这次讨论有什么看法？或者在你的 Go 项目中，是如何保障系统稳定性的？欢迎在评论区留下你的宝贵经验！

精进有道，更上层楼

极客时间《Go语言进阶课》上架刚好一个月，受到了各位读者的热烈欢迎和反馈。在这里感谢大家的支持。目前我们已经完成了课程模块一『语法强化篇』的 13 讲，为你系统突破 Go 语言的语法认知瓶颈，打下坚实基础。

现在，我们即将进入模块二『设计先行篇』，这不仅包括 API 设计，更涵盖了项目布局、包设计、并发设计、接口设计、错误处理设计等构建高质>量 Go 代码的关键要素。

这门进阶课程，是我多年 Go 实战经验和深度思考的结晶，旨在帮助你突破瓶颈，从“会用 Go”迈向“精通 Go”，真正驾驭 Go 语言，编写出更优雅、
更高效、更可靠的生产级代码！

扫描下方二维码，立即开启你的 Go 语言进阶之旅！

感谢阅读！

如果这篇文章让你对Go语言有了新的认识，请帮忙转发，让更多朋友一起学习和进步！

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求，请扫描下方公众号二维码，与我私信联系。