Golang - Tony Bai

标签 Golang 下的文章

AI 基础设施的语言之争：为何构建 LLM 网关时，我们放弃了 Python 选择了 Go？

二月 18, 2026
0 条评论

本文永久链接 – https://tonybai.com/2026/02/18/why-we-chose-go-over-python-for-llm-gateways

大家好，我是Tony Bai。

在 2026 年的今天，人工智能早已走出了实验室，成为企业级应用的核心驱动力。Python，凭借其在机器学习领域的绝对统治地位——拥有 PyTorch、TensorFlow、Hugging Face 等无可匹敌的生态系统——长期以来被视为 AI 开发的“默认语言”。

然而，随着 AI 应用从模型训练（Training）走向推理服务（Inference）和应用编排（Orchestration），工程重心发生了微妙的转移。当我们谈论模型本身时，Python 是王者；但当我们谈论承载模型流量的基础设施——网关、代理、路由器时，Python 还是最佳选择吗？

近日，开源 LLM 网关项目 Bifrost 的维护者在 Reddit 上分享了一篇题为《Why we chose Go over Python for building an LLM gateway》的技术复盘，引发了社区的强烈反响。他们放弃了拥有 LiteLLM 等成熟竞品的 Python 生态，转而使用 Go 重写了核心网关。结果令人咋舌：延迟降低了约 700 倍，内存占用降低了 68%，吞吐量提升了 3 倍。

这场技术选型的背后，折射出的是 AI 工程化进入深水区后，对并发模型、资源效率与部署架构的重新审视。

Python 的“舒适区”与“性能墙”

在项目的初期，选择 Python 似乎是理所当然的。

1. 生态惯性与“胶水”优势

绝大多数 AI 工程师都是 Python Native。从 LangChain 到 LlamaIndex，几乎所有的 Agent 开发框架都优先支持 Python。使用 Python 构建网关，意味着可以直接复用现有的库，甚至可以直接挂载一些轻量级的 Python 逻辑来处理 Embeddings 或 RAG（检索增强生成）流程。FastAPI 的易用性更是让开发者能在几分钟内搭建起一个服务。

2. 遭遇瓶颈：网关的本质是 I/O

然而，LLM 网关的业务属性决定了它的性能痛点。与计算密集型（CPU-bound）的模型推理不同，网关是典型的 I/O 密集型应用。它的核心职责是：

接收成千上万的客户端请求。
将请求转发给上游提供商（如 OpenAI, Anthropic, 或自建的 vLLM）。
等待上游响应（这是最耗时的环节，LLM 的首字延迟 TTFT 通常在秒级）。
将流式响应（SSE）回传给客户端。

在这个过程中，网关绝大部分时间都在“等待”。

3. Python 的并发痛点

Bifrost 团队在测试中发现，当并发请求数达到 500-1000 RPS（每秒请求数）时，Python 的瓶颈开始显现。

GIL（全局解释器锁）的幽灵：虽然 Python 的 asyncio 可以处理 I/O 并发，但 GIL 依然限制了多核 CPU 的利用率。对于需要处理大量并发连接、同时可能涉及少量数据处理（如 Token 计数、PII 过滤）的网关来说，线程竞争（Thread Contention）成为了不可忽视的开销。
昂贵的上下文切换：在 Python 中维持数千个并发连接，其上下文切换的开销远高于编译型语言。

Go 的降维打击——数据背后的技术真相

Bifrost 团队最终选择了 Go。这一决定并非出于对语言的偏好，而是基于冷冰冰的 Benchmark 数据。让我们深入分析他们披露的核心指标。

延迟（Latency）：微秒与毫秒的鸿沟

数据对比：
* Bifrost (Go): ~11 微秒 (0.011ms) / 请求
* LiteLLM (Python): ~8 毫秒 / 请求

这是一个惊人的 700 倍 差距。

虽然 8 毫秒在人类感知中似乎微不足道，但在高并发架构中，这被称为“开销放大”。

累积效应：在一个复杂的 AI Agent 工作流中，可能涉及几十次 LLM 调用。如果每一层网关都增加 8ms 的延迟，累积起来就是可感知的卡顿。
高负载下的劣化：在 10,000 个并发请求下，Go 引入的总处理时间仅为 110ms，而 Python 方案则产生了惊人的 80 秒总 CPU 时间开销。这意味着 Python 方案需要消耗更多的 CPU 核心来维持同样的响应速度，否则请求就会排队，导致尾部延迟（Tail Latency）飙升。

此外，Go 的 net/http 标准库在处理 HTTP 请求时经过了极致优化。Go 不需要像 Python 那样依赖 ASGI/WSGI 服务器（如 Uvicorn），其原生的 HTTP 处理能力配合 Goroutine，使得每个请求的内存分配和 CPU 周期都降到了最低。

并发模型：Goroutine vs Asyncio

架构对比：
* Go: 10,000 个 Goroutines，每个仅占用 ~2KB 栈空间。
* Python: 受限于 OS 线程开销或 Event Loop 的单核瓶颈。

LLM 网关的特殊性在于长连接。LLM 的流式输出可能持续数秒甚至更久。这意味着网关必须同时维护成千上万个活跃连接。

Go 的 GMP（Goroutine-Machine-Processor）调度模型天生适合这种场景。成千上万个 Goroutine 可以复用少量的系统线程，上下文切换由 Go Runtime 在用户态极速完成，几乎不消耗系统内核资源。

相比之下，Python 即使使用了 uvloop，在面对海量并发连接的数据搬运时，其解释器的开销依然是一个沉重的包袱。

内存效率与成本

数据对比：
* Go: 内存占用降低 ~68%。
* 生产环境: Go 跑在 t3.medium (2 vCPU, 4GB) 上即可；Python 则需要 t3.xlarge。

对于大规模部署 AI 服务的企业来说，这意味着基础设施成本直接减半。

Python 的动态类型系统和垃圾回收机制导致其对象内存占用较大。而 Go 的结构体布局紧凑，且编译器能进行逃逸分析（Escape Analysis），将大量对象分配在栈上而非堆上，从而显著降低了 GC 压力和内存占用。

社区深度探讨——AI 时代的语言版图重构

这篇帖子在 r/golang 引发了极高质量的讨论，评论区揭示了行业内更深层次的趋势。

“AI 能够写代码”改变了竞争规则

过去，Python 的一大优势是“开发效率高”。写 Python 代码通常比写 Go 或 Rust 快。

但在 2026 年，“Agentic Coding”（即利用 AI Coding Agent 辅助编程）已经成为主流。

有开发者指出：“LLM 让编写 Rust 和 Go 变得非常高效，你完全可以享受到高性能语言的红利，而不用支付编写它们的‘学习成本’。”

这是一个极其深刻的洞察。

Rust 的借用检查器：以前是新手的噩梦，现在 LLM 可以很好地处理生命周期标注。
Go 的样板代码：if err != nil 虽然繁琐，但 Copilot/Cursor/Claude Code等可以一键生成。

当“编写代码”不再是瓶颈时，“运行时性能”和“稳定性”的权重就被无限放大了。这进一步削弱了 Python 在后端基础设施层的竞争力。

Rust 还是 Go？

既然要高性能，为什么不直接上 Rust？

评论区对此展开了激辩。虽然 Rust 在理论上拥有比 Go 更高的性能上限和内存安全性（无 GC），但 Go 在“开发效率”与“运行效率”之间找到了完美的平衡点。

Rust: 适合构建数据库、搜索引擎内核等对延迟极其敏感且逻辑复杂的底层组件。但 Rust 的“认知负担”依然较重，且编译速度较慢。
Go: 提供了 80% 的 Rust 性能，但只有 20% 的开发难度。对于网关、代理这类中间件，Go 的标准库（特别是 net/http）极其成熟，编译速度极快，且自带 GC 能让开发者从内存管理的细节中解脱出来，专注于业务逻辑（如限流、计费）。

对于大多数 AI 网关场景，Go 是性价比最高的选择。

Python 的归宿：模型与胶水

这是否意味着 Python 将被淘汰？绝不。

社区共识非常明确：Python 的护城河在于 ML 生态。

模型训练与微调：PyTorch/JAX 无可替代。
数据科学与探索：Jupyter Notebook 是数据科学家的后花园。
快速原型开发：在验证想法阶段，Python 依然是最快的。

但在生产环境部署（Production Serving）阶段，架构正在发生分离：

控制平面（Control Plane）：由 Go/Rust 接管，负责流量调度、鉴权、日志、监控。
数据平面（Data Plane）：核心推理引擎（如 vLLM）虽然内部可能有 C++/CUDA 优化，但外层接口仍常由 Python 封装。

Go 在 AI 领域的未来展望

Bifrost 的案例只是冰山一角。我们正在目睹 Go 语言在 AI 领域的“新基建”运动。

静态二进制文件的魅力

Deployment simplicity 是作者提到的另一个关键点。

部署 Python 应用通常意味着：配置 Docker -> 安装 Python -> pip install requirements.txt -> 解决依赖冲突 -> 虚拟环境管理。

而部署 Go 应用：COPY bifrost /usr/local/bin/ -> Run。

在容器化和 K8s 盛行的今天，Go 的静态链接二进制文件极大地简化了 CI/CD 流程，减小了镜像体积，提升了冷启动速度（这对于 Serverless AI 推理尤为重要）。

AI 专有工具链的完善

虽然 Go 在 Tensor 操作库上不如 Python 丰富，但在应用层工具上正在迅速补齐。

LangChainGo: 社区正在移植 LangChain 的核心能力。
Vector Database Clients: Milvus, Weaviate, Pinecone 等向量数据库都有优秀的 Go SDK。
主流大模型 GenAI SDK: 像Google等主流大模型厂商官方对 Go 的支持力度都很大，Gemini、Claude、OpenAI 等模型的 Go SDK 体验都还不错。

架构师的决策建议

如果你正在构建一个 AI 应用平台：

不要用 Python 写网关：不要让 GIL 成为你高并发路上的绊脚石。
不要用 Go 写模型训练：不要试图挑战 PyTorch 的地位，那是徒劳的。
采用“三明治架构”：
- 上层：Go 处理高并发 HTTP 请求、WebSocket、SSE。
- 中层：Go 处理业务逻辑、数据库交互、Redis 缓存。
- 底层：Python/C++ 容器专门负责模型推理，通过 gRPC 与 Go 层通信。

小结

Bifrost 从 Python 到 Go 的迁移，不仅仅是一次代码重写，更是一次架构理念的升级。它证明了在 AI 浪潮中，基础设施的性能与模型的智能同等重要。

随着 LLM 应用规模的爆发式增长，计算成本和响应延迟将成为企业关注的焦点。Go 语言凭借其高效的并发模型、极低的资源占用和极简的部署体验，正在成为 AI 基础设施层的“事实标准”。

对于 Gopher 而言，这是一个最好的时代。我们不需要成为算法专家，只需要发挥 Go 语言最擅长的能力——构建高性能、高可靠的管道，就能在 AI 时代占据不可或缺的一席之地。

资料链接：https://www.reddit.com/r/golang/comments/1r27pqx/why_we_chose_go_over_python_for_building_an_llm/

你认为 Python 会被“边缘化”吗？

随着 Agentic Coding 的普及，高性能语言的入门门槛正在消失。在你的 AI 实践中，是否也感受到了 Python 在生产部署时的无奈？你认为 Go 在 AI 领域还会攻下哪些阵地？

欢迎在评论区分享你的看法！

还在为“复制粘贴喂AI”而烦恼？我的新专栏 《AI原生开发工作流实战》 将带你：

告别低效，重塑开发范式
驾驭AI Agent(Claude Code)，实现工作流自动化
从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码，开启你的AI原生开发之旅。

你的Go技能，是否也卡在了“熟练”到“精通”的瓶颈期？

想写出更地道、更健壮的Go代码，却总在细节上踩坑？
渴望提升软件设计能力，驾驭复杂Go项目却缺乏章法？
想打造生产级的Go服务，却在工程化实践中屡屡受挫？

继《Go语言第一课》后，我的《Go语言进阶课》终于在极客时间与大家见面了！

我的全新极客时间专栏《Tony Bai·Go语言进阶课》就是为这样的你量身打造！30+讲硬核内容，带你夯实语法认知，提升设计思维，锻造工程实践能力，更有实战项目串讲。

目标只有一个：助你完成从“Go熟练工”到“Go专家”的蜕变！现在就加入，让你的Go技能再上一个新台阶！

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求，请扫描下方公众号二维码，与我私信联系。

Go 1.26 ：go mod init 默认行为的变化与 Go 版本管理的哲学思辨

二月 16, 2026
0 条评论

本文永久链接 – https://tonybai.com/2026/02/16/go-1-26-go-mod-init-changes-version-management-philosophy

大家好，我是Tony Bai。

在 Go 语言的开发日常中，go mod init 是每个新项目诞生的起点。对于大多数开发者而言，这行命令只是一系列机械性的动作中的一环：创建一个文件夹，输入命令，生成 go.mod，然后开始写代码。

然而，在这个看似简单的动作背后，隐藏着一个长期困扰库维护者的问题：默认的 go 指令版本。

Go 1.26中，Go 核心团队接受了一项重要的提案（Issue #74748），修改 go mod init 的默认行为：将默认生成的 go 版本指令从当前工具链版本（N），修改为前一个次要版本（N-1）。

这个看似微小的改动，实际上触及了 Go 语言在模块兼容性、开发者体验以及生态演进策略上的深层思考。本文将从这个提案出发，剖析 go.mod 文件的核心机制、版本策略的权衡，以及这对我们未来的 Go 开发意味着什么。

现状与痛点：被“无心之失”阻断的兼容性

默认行为的逻辑

在 Go 1.26 之前（包括目前的 1.24/1.25 版本），当你安装了最新的 Go 工具链（假设为 Go 1.25.0）并运行 go mod init example.com/mylib 时，生成的 go.mod 文件会如下所示：

module example.com/mylib

go 1.25

这一行 go 1.25 意味着什么？它向 Go 编译器和构建工具声明：“这个模块需要至少 Go 1.25 版本的语言特性和标准库行为。”

库作者的困境

对于应用程序（Application/Binary）开发者来说，这通常不是问题，因为你控制着部署环境。但对于库（Library）作者来说，这往往会带来意想不到的麻烦。

设想这样一个场景：

你是一名热衷于尝试新技术的开发者，第一时间升级到了 Go 1.25。你写了一个通用的工具库 mylib，代码非常简单，只用到了 Go 1.20 就已经存在的特性。你运行 go mod init，发布了 v1.0.0。

此时，另一位开发者 Alice 想要在她的项目中使用你的库。她的公司出于稳定性考虑，生产环境使用的是 Go 1.24（这是完全受官方支持的版本）。当她尝试 go get example.com/mylib 时，会收到报错：

go: example.com/mylib@v1.0.0 requires go >= 1.25; your go version is 1.24.5

Alice 感到困惑：你的代码明明没有用任何 1.25 的新特性（比如尚未发布的新语法糖等），为什么强行要求 1.25？

这就是现状的痛点：go mod init 过于激进地将当前工具链版本作为最低版本要求，导致许多本可以兼容旧版 Go 的库，无意间将仍处于官方支持周期内的老版本用户拒之门外。

提案详情：退一步，海阔天空

为了解决上述问题，Dmitri Shuralyov 提出了 #74748 提案，建议修改 go mod init 的默认行为。

新的默认规则

从 Go 1.26 开始，go mod init 将遵循以下逻辑：

如果当前工具链是稳定版 1.N.M：默认生成的 go 指令为 1.(N-1).0。
- 例如：使用 Go 1.26.0 工具链初始化，go.mod 将写入 go 1.25.0。
如果当前工具链是预览版（Pre-release/RC）：默认生成 1.(N-2).0。
- 例如：使用 Go 1.26rc1 工具链初始化，go.mod 将写入 go 1.24.0。

设计动机

Go 官方的发布策略是支持最近的两个主要版本。例如，当 Go 1.26 发布时，Go 1.26 和 Go 1.25 是受支持的版本，而 Go 1.24 将停止维护。

通过将默认版本设置为 N-1，新创建的模块将自动兼容当前所有受官方支持的 Go 版本。

这是一种“退一步”的策略。对于绝大多数新项目，尤其是开源库，初始代码很少会立即依赖刚刚发布的那个版本才引入的语言特性。默认向下兼容一级，可以显著减少“因为作者忘了改 go.mod 而导致用户无法使用”的情况，极大地提升了生态系统的连通性。

深度解析：go 指令究竟控制着什么？

要理解为什么社区对这个改动讨论如此热烈，我们需要深入理解 go.mod 中 go 1.xx 这行指令到底控制了哪些东西。它不仅仅是一个版本号，它是 Go 向前兼容性（Forward Compatibility）和向后兼容性（Backward Compatibility）的总开关。

语言特性开关

这是最直观的作用。它决定了编译器允许使用哪个版本的语法。

如果你的 go.mod 写着 go 1.17，即使你用 Go 1.21 的工具链编译，你也不能使用泛型（Go 1.18 引入）。
如果你的 go.mod 写着 go 1.21，你不能使用 for range 整数（Go 1.22 引入）。

这也引发了该提案最大的争议点（下文会详述）：新手困惑。如果默认设为旧版本，新手使用新版 Go 安装后，却发现无法使用新特性，可能会感到迷茫。

依赖解析策略

Go 的模块加载机制随版本演进过程。例如：

Go 1.17 引入了 Module Graph Pruning（依赖图修剪），只有 go 1.17 及以上才会默认开启更高效的依赖加载方式。
Go 1.21 彻底改变了工具链管理，引入了 toolchain 指令。

标准库行为与 GODEBUG

这是最容易被忽视，但对生产环境影响最大的部分。

Go 团队为了保证兼容性，不仅保证代码能编译，还尽力保证运行时行为的一致性。当标准库需要修复一个 Bug 或更改一个默认行为（这可能会破坏依赖旧行为的用户）时，通常会通过 GODEBUG 变量来控制。

关键点在于：go.mod 中的 go 版本决定了 GODEBUG 的默认值。

例如（虚构案例）：假设 Go 1.26 决定修改 net/http 的默认超时策略，为了兼容，Go 1.26 会检查 go.mod：

如果 go.mod 是 go 1.26：使用新策略。
如果 go.mod 是 go 1.25：即使是用 Go 1.26 编译，依然默认使用旧策略，以保持行为不变。

在提案讨论中，有开发者敏锐地指出了这一点：

“When looking at #76677 I realized this will have the unintended(?) effect of delaying any non security changes gated behind GODEBUGs…”
(我意识到这将产生一个非预期的副作用：它会推迟所有由 GODEBUG 控制的非安全变更的生效时间。)

这意味着，如果你用 Go 1.26 初始化项目，默认得到 go 1.25，那么你虽然用着最新的编译器，但你的程序运行时行为（针对那些有破坏性变更的边缘情况）实际上是运行在“兼容模式”下的。这对于稳定性是好事，但对于想要立即获得最新修复（非安全类）的用户来说，可能是一个隐性阻碍。

社区的辩论：便利性 vs. 最佳实践

在 GitHub Issue #74748 的讨论区，Go 社区的大佬们也曾展开了精彩的辩论。

支持方

开发者mvdan 强烈支持这一变更。他指出：

“Since I daily drive tip, I practically always have to fix up a module after go mod init if I want it to work anywhere else.”
(因为我日常使用开发版分支，每次初始化模块后，我几乎都必须手动修改 go.mod 才能让它在别处工作。)

这也是许多库作者的心声。经验丰富的开发者在发布库之前，往往会手动将 go 版本调低，以匹配 Ubuntu LTS 或 Debian Stable 等发行版中较旧的 Go 版本。既然这是最佳实践，为什么不让工具自动完成呢？

反对方

反对方主要担心两点：

初学者的体验：一个刚学 Go 的新手，下载了最新的 Go 1.26，看到教程里有很酷的新语法。他运行 go mod init，然后把代码粘贴进去，结果报错说“语法不支持”。这会让人非常沮丧。
隐式行为：go 指令应该是一个显式的声明。有开发者认为：“想要支持旧版本应该是一个有意识的选择。” 默认使用旧版本，可能会让开发者在无意中错过了新版本的改进。

最终的权衡

对此，mvdan 给出了有力的反驳：

“In fact I would argue the opposite – we should not encourage new Go users to use the latest language features the moment they are available. Breaking users on slightly older versions of Go should be a conscious choice.”
(事实上我持相反观点——我们不应该鼓励新用户在新特性刚出时就立即使用。因使用新特性而破坏对旧版本用户的兼容性，这才应该是一个有意识的选择。)

这句话道出了 Go 哲学的一大核心：工程素养优于尝鲜冲动。

Go 的编译器错误信息已经做得非常好。如果因为版本过低导致语法不支持，编译器会明确提示“升级 go.mod 中的版本”。这对于新手来说是一个学习 Go 版本管理机制的好机会，而不是不可逾越的障碍。

我们该如何应对？

这个变更在刚刚发布的Go 1.26中已经落地，它背后的逻辑现在就值得我们应用。

库开发者（Library Authors）

如果你在维护一个开源库，不要仅仅因为你安装了最新版 Go，就让你的库依赖最新版 Go。

手动降级：在 go mod init 后，手动编辑 go.mod，将其改为你实际需要的最低版本。例如，如果你没用泛型，甚至可以设为 go 1.17（虽然现在来看有点太老了，通常建议支持最近 3-4 个版本）。
CI 验证：在 GitHub Actions 中，不要只测试 latest，一定要测试你声明的最低版本（Min Go Version）。

应用开发者（App Developers）

如果你在开发一个最终产品（Web 服务、CLI 工具），你通常希望使用最新的运行时优化和特性。

手动升级：在使用 Go 1.26 初始化后，如果你确定需要最新的调度器优化或 GC 改进，可以运行 go get go@1.26 或手动修改 go.mod。
关注 GODEBUG：了解你的 go 指令版本不仅影响语法，还影响 GODEBUG 的默认配置。如果你在排查诡异的 Bug，检查一下是不是因为 go 版本过低导致运行在“兼容模式”。

小结：Go 的成熟与克制

Go 1.26 对 go mod init 的这一改动，反映了 Go 语言已经从一个“快速迭代、功能补齐”的青春期，步入了一个“注重生态、强调兼容”的成熟期。

在 Rust、Python 等社区，往往倾向于推动用户使用最新版。而 Go 选择了一种更为克制的道路：工具链默认帮开发者选择了兼容性更好的路径，而不是特性更炫酷的路径。

这很“Go”。

它提醒我们，软件工程不仅仅是写出能跑的代码，更是要写出能被更多人使用、能长期稳定运行的代码。

对于 Gopher 们来说，下一次当你敲下 go mod init 时，看到那个比你安装的版本低一号的数字，请不要惊讶。那是 Go 团队在向你传递一种无声的哲学：Slow down, and carry everyone along.（慢一点，带着大家一起走。）

参考资料

你怎么选？

在 Go 1.26 之后，你打算在 go mod init 后立即升级到最新版本，还是遵循官方建议保持“退一步”的兼容性？在你的项目中，是否也曾因为 go.mod 版本设置过高而导致同事或用户报错？

欢迎在评论区分享你的版本策略！