标签 Google 下的文章

大洗牌!Google 内部确认:Go 正取代 C++,成为 AI Agent 时代的“通用语言”

本文永久链接 – https://tonybai.com/2026/05/21/go-is-the-new-lingua-franca-for-ai-agents-at-google

大家好,我是Tony Bai。

在过去的两年里,只要一提到 AI 开发,99% 的人脑海中弹出的第一个词绝对是:Python。而如果是涉及到大模型底层的高性能推理与算力压榨,大家想到的必然是 C++ 或是 Rust

但在真正的工程落地中,情况正在发生一场令人猝不及防的剧变。

最近,Google 资深软件工程师 Jaana Dogan(@rakyll)在 X(原推特)上发布了一条引发技术圈热议的推文

“Go 成为 Google 内部 Agentic(智能体)系统的通用语言(lingua franca),这真的很了不起。我以前从未看到过 Go 有取代 C++ 的路径,但现在我相信这是可能的。”

这不仅仅是一条简单的技术感慨,它揭示了 AI 浪潮进入“下半场”后的核心工程困境:当我们把大模型封装成 Agent,并让成千上万个 Agent 并发协作时,Python 太脆弱,C++ 太沉重,而 Go,迎来了它的“天命时刻”。

今天,我们就来扒一扒,为什么 Google 会让 Go 接管 AI Agent 的底层开发?这对我们普通开发者的技术栈转型,又意味着什么?

打破滤镜:为什么 Python 和 C++ 在 Agent 时代“失宠”了?

要理解 Go 的上位,我们首先要搞清楚,AI Agent 到底需要什么样的工程能力。

现在的 AI 应用,早就不是早期那种“写个 Python 脚本,调用一下 OpenAI API,把结果打印出来”的玩具了。真实的 Agentic 系统(智能体系统)包含了极其复杂的网络 I/O、并发工具调用(Tool Calling)、多智能体消息路由、长时记忆状态管理,以及大规模的分布式容错。

在这个场景下,旧有的王者们暴露出了致命的缺陷:

1. Python 的“工程化陷阱”

Python 是 AI 研究员的最爱,因为它的数据科学库天下无敌。但当你要构建一个高并发、高可用、需要 24/7 运行的 Agent 编排系统时,Python 的弱类型(重构火葬场)和 GIL(全局解释器锁,导致无法真正利用多核并发)就成了灾难。正如原贴讨论区一位开发者所言:“模型层可能是 Python 的天下,但围绕着模型的 Runtime(运行时环境)正越来越像 Go 的领地。”

2. C++ 的“杀鸡用牛刀”

C++ 拥有极致的性能,是模型训练和推理引擎(Inner Loop)的绝对霸主。但 Agent 编排系统真的需要 C++ 级别的疯狂数学计算吗?不需要。

Agent 系统本质上是大量的网络等待(等 LLM 返回结果、等数据库查询、等网页抓取)。用 C++ 来写极其复杂的并发网络请求和状态机,不仅开发周期漫长,而且极易产生内存泄漏。正如推文评论所指出的:“C++ 背负了太多的历史包袱,它在 Agent 编排上显得太重了。”

Go 凭什么上位?Goroutine 与 Agent 的“完美同构”

Go 语言在这个时间节点爆火,并非偶然,而是因为它底层的并发哲学与 AI Agent 的行为模式产生了“完美的同构映射”

在 X 上的讨论中,多位资深开发者一针见血地指出了核心原因:

“Goroutines mapping directly to concurrent agent communication is the reason why it makes perfect sense.”(Goroutine 直接映射到并发 Agent 之间的通信,这是它如此完美契合的原因。)

让我们用大白话来翻译一下这个硬核逻辑:

什么是多智能体系统(Multi-Agent System)?本质上就是一堆各自独立的“数字员工”,它们一边自己干活,一边通过发消息相互沟通。
而 Go 语言最强大的杀手锏是什么?正是 CSP(通信顺序进程)并发模型,即 Goroutine(轻量级协程)和 Channel(通道)。

  • 当你启动一个 Agent 时:在 Go 里,你只需要一个简单的 go runAgent(),就能以极其低廉的内存代价(几 KB)启动一个并发实体。一千个 Agent?一万个 Agent?对 Go 来说毫无压力。
  • 当 Agent 之间需要协作对话时:你不需要去搞复杂的锁(Locks)或者共享内存,你只需要用 Go 的 Channel 把消息塞过去,另一个 Agent 就能安全地接收。

Agent 的编排,需要的是“轻量级的并发管理”,而不是“极致的数学计算速度”。这简直就是为 Go 量身定制的战场。

征服大厂,构建 Agent 架构的“铁三角”

除了并发模型上的天作之合,评论区的一位开发者还另外总结了 Go 赢下这场战争的另外三个决定性因素。他指出,现代 Agent 技术栈奖励三种特性,而 “Go 完美击中了这三点(Go nails all three)”

1. 强类型系统(Types):告别“盲盒”开发

Agent 系统中充斥着复杂的 JSON 解析、Tool Calling 的参数校验、以及结构化的输出。Python 的字典(Dict)传递在项目变大后就像是“盲盒”,你永远不知道里面缺了哪个字段。而 Go 的强类型 Struct 和极度清晰的错误处理机制(虽然大家都吐槽 if err != nil,但它确实极其可控),让系统拥有了极高的可预测性(Predictability)。

2. 极速的编译体验(Fast Builds)

“编译速度是让它成为绝配的原因之一。”在快速迭代的 AI 产品中,Go 那种秒级的编译速度,让开发者可以飞速地测试 Agent 的行为逻辑。相比之下,C++ 那漫长的编译过程在需要高频微调的 AI 时代显得格格不入。

3. 小巧的单一二进制文件(Small Binaries)

当你把 Agent 部署到云端、边缘设备甚至是 Serverless 环境时,Go 编译出来的是一个无需任何外部依赖的独立执行文件。没有 Python 烦人的环境依赖(无需折腾 pip, conda, 虚拟环境),直接丢进一个极小的 Docker 镜像中就能运行,这对于现代云原生运维来说是无可估量的优势。

一个反直觉的冷知识:大模型“最爱”写 Go 代码

推文中一个开发者提出了一个极其有趣且经常被忽视的视角:在 LLM(大语言模型)的眼中,Go 是一门完美的语言。

如果你经常用 Cursor/Codex/Claude Code等 写代码,你会发现一个现象:让 AI 写 Python,它经常会用错第三方库的版本;让 AI 写 C++ 或 Scala,它可能会搞出一堆极其复杂的继承、多态或者生命周期错误。

但如果你让 AI 写 Go 呢?成功率出奇的高。

原因在于:

  1. Go 的语法极致简单、无聊,甚至“没有类(Classes)”。它只有 Struct 和接口,这极大地减少了代码的“表面积(Surface Area)”。
  2. Token 使用率极高。由于没有复杂的黑魔法和繁琐的泛型体系(早期),LLM 在生成 Go 代码时不容易出现“幻觉”,维护起来极其容易。

在这个连代码本身都开始由 AI 生成的时代,“对 LLM 友好”竟然成了一门编程语言的核心护城河。

终局推演 —— C++ 守住“内环”,Go 赢下“外环”

那么,Go 真的会彻底消灭 C++ 吗?

并不完全是。这场讨论最终达成了一个非常清晰的技术栈共识:

“C++ still wins the inner loop. Go wins everything around it.”(C++ 依然赢得了内环,而 Go 赢得了周围的一切。)

未来的 AI 系统架构已经初露端倪,它将被清晰地划分为三个层级:

  1. 研究与数据层(Python):用于模型训练、数据清洗、算法验证。
  2. 算力内环(C++ / Rust / CUDA):大模型的推理引擎(如 vLLM、Ollama 底层)、张量计算。这里需要极致榨干每一滴 GPU 性能,C++ 依然是绝对的霸主。
  3. 编排外环与业务层(Go):这是距离普通开发者最近、也是市场需求最大的地方。成千上万的 Agent 调度、API 网关、并发的数据检索(RAG)、记忆数据库交互、工具链调用,全部都将被 Go 统治。

最新铁证!Google I/O 2026 震撼官宣:废弃旧路线,用 Go 重写 AI 核心入口!

如果你觉得前面硅谷大佬们的讨论还只是“理论推演”,那么在刚刚举办的 Google I/O 2026 大会上,Google 官方直接用一记雷霆手段,把这个趋势变成了既成事实。

Google 开发者博客发布了公告:正式宣布停止维护原有的 Gemini CLI,全面过渡到全新的“Google Antigravity(反重力)”多智能体开发平台,并推出全新的核心入口 —— Antigravity CLI

而在官方给出的技术变更文档中,最扎眼、最让 Go 开发者狂喜的一条更新理由,白纸黑字地写着:

“Faster execution: Built in Go, Antigravity CLI is snappier and more responsive.” (更快的执行速度:基于 Go 语言构建,Antigravity CLI 更加轻快、响应更迅速。)


图:Google I/O 2026:旧版 CLI,用Antigravity CLI替代

旧版的 Gemini CLI 是基于传统脚本语言(Node.js/TS 体系)构建的,在处理单点交互时绰绰有余。但 Google 明确表示,现在开发者的需求已经彻底变了:“你现在需要多个 Agent 相互通信、分工合作来解决复杂的系统问题。”

当单点 CLI 变成“多 Agent 协同编排后端”时,旧有的 JS/TS 体系在高并发、异步工作流(Asynchronous Workflows)和底层系统控制上面临性能瓶颈。Google 毫不犹豫地选择用 Go 语言 彻底重写,就是为了利用 Go 极致的并发和执行效率,来支撑起“后台多任务并发运行、且不锁定终端”的强悍体验。

小结:给开发者的生存建议

过去的一年里,无数后端开发者感到焦虑,觉得自己掌握的 CRUD 技能在 AI 面前一文不值。但 Google 内部的这场技术栈迁移,给我们指明了一条无比清晰的道路:

别再只盯着 Python 看了。

当 AI 从单一的对话框,走向全面接管企业业务流的多智能体(Multi-Agent)协作形态时,对高并发、高可用后端工程能力的需求不仅没有减少,反而呈指数级爆发。

学习 Go 语言,理解 Goroutine,掌握如何构建一个稳健的 Agent 编排框架。因为决定下一个十年 AI 应用成败的,不再是模型本身的算力,而是谁能最好地管理和协调这些拥有智能的“数字大军”。

而目前来看,Go,已经在这场战役中拔得头筹。

资料链接:https://x.com/rakyll/status/2056528039698403498


今日互动探讨:

你目前在开发 AI 应用或 Agent 系统时,使用的是什么语言?你是否遇到了 Python 在高并发或部署时的痛点?欢迎在评论区分享你的实战经验与踩坑血泪史,我们一起探讨 AI 时代的最佳实践!


还在为写 Agent 框架频频死循环、上下文爆炸而束手无策?我的新专栏 从0 开始构建 Agent Harness 将带你:

  • 抛弃臃肿框架,回归“驾驭工程 (Harness Engineering)”的第一性原理
  • 用 Go 语言手写 ReAct 循环、并发拦截与上下文压缩引擎等,复刻极简OpenClaw
  • 构建坚不可摧的 Safety Middleware 与飞书人工审批防线
  • 在底层实现 Token 成本审计、链路追踪与自动化跑分评估
  • 从“调包侠”进化为掌控大模型边界的“AI 操作系统架构师”

扫描下方二维码,开启从 0 开始构建Agent Harness 的实战之旅。


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

谷歌一篇论文砸崩内存巨头?不懂“显存墙”,怎么做 AI 时代的工程师!

本文永久链接 – https://tonybai.com/2026/03/28/ai-engineer-gpu-introduction-course

大家好,我是Tony Bai。

就在最近,科技界发生了一件极其戏剧性的事情。本周三美股开盘,全球存储产业巨头——美光、西部数据、希捷的股价遭遇了“黑色时刻”,普遍明显下跌(3%~6%)。

引发这场资本市场大地震的,不是什么贸易战,也不是财报暴雷,而仅仅是谷歌(Google Research)发布的一篇技术论文:《TurboQuant: Redefining AI efficiency with extreme compression

这篇论文宣称,他们发明了一种极端的压缩算法,能在几乎零损耗的情况下,将大模型推理时的 KV 缓存(KV Cache)暴降 6 倍,并让注意力机制的计算速度狂飙 8 倍

很多传统的后端程序员看到这条新闻,可能一头雾水:

  • 什么是 KV Cache?
  • 为什么压缩了一个叫 KV Cache 的东西,就能让卖物理内存芯片的巨头们吓得半死?

在这些雾水和疑惑背后,隐藏着 AI 大模型时代最核心、也最残酷的技术真相:内存墙(Memory Wall)

AI 时代的底色:算力过剩,访存为王

在传统的软件开发中,我们习惯了用 CPU 的思维去思考性能。我们认为程序跑得慢,是因为“计算太复杂”,我们需要更强的算力(更快的 CPU 频率)。

但在大语言模型(LLM)的世界里,逻辑变了。

大模型在生成文本时,是逐字生成(自回归)的。为了不每次都把前面说过的话重新计算一遍,模型会把之前所有上下文的内部特征(Key 和 Value 矩阵)全部保存在显存里。这份庞大的“运行记忆”,就是 KV Cache

随着上下文越来越长(比如从 4K 飙升到 128K 甚至百万级),这份 KV Cache 会像滚雪球一样膨胀。

这就是为什么业界说:KV Cache 是大模型推理名副其实的“吞金兽”。

更要命的是,每次生成一个新的字,GPU 都必须把这份庞大的 KV Cache 从显存(HBM)完整地搬运到计算核心(SRAM)里过一遍。

这就好比你有一个世界上切菜最快的厨师(GPU 算力),但他每次切一片肉,都要跑到 10 公里外的仓库(显存)去取。厨师的手速再快也没有用,整体速度完全被运货卡车的速度(显存带宽)锁死了。

这就是困扰所有 AI 工程师的 “内存墙”。也是为什么各大公司疯狂抢购高显存、高带宽的 H100 显卡的原因。

而谷歌的 TurboQuant 之所以引发地震,正是因为它通过极致的数学算法(极坐标变换 + 1-bit 残差误差校验),直接在软件层面把搬运的数据量压缩了 6 倍!这意味着,同样的硬件,现在能跑更长的上下文、支持更高的并发。存储巨头们能不慌吗?

为什么后端工程师必须懂 GPU?

你可以说:“我只是个调 OpenAI 兼容API 的后端工程师,硬件底层关我什么事?”

在过去的一年里,这是行得通的。但随着开源模型(如 GLM、Qwen、MiniMax、DeepSeek、KIMI等)的全面爆发,以及企业对数据隐私、成本控制的极致追求,“本地化/私有化部署大模型” 也正在成为一些中大型企业的刚需。

当你作为架构师或后端主力,被老板要求把一个 70B 的大模型部署到公司的服务器上时,真正的挑战才刚刚开始:

  • 面对 OOM(显存溢出),你该如何调整参数?
  • 并发量稍微一高,首字延迟(TTFT)就卡到几十秒,你该怎么排查?
  • 采购硬件时,你是买 8 张便宜的 RTX 4090,还是花高价租用带 NVLink 的 A100/H100?
  • 你该如何向团队解释引入 vLLM、FlashAttention 和 INT8/FP8 量化的必要性?

如果你把 GPU 当成一个“跑得更快的 CPU”来用,你将会在上述每一个问题上栽大跟头。

你需要建立一套全新的“硬件心智模型”,这也是我编写这门《AI 工程师的 GPU 入门课:从硬件视角看大模型推理》微专栏的主要目标。

这门微专栏将教你什么?

市面上关于 GPU 和 CUDA 的教程很多,但大多是教你如何写出复杂的 C++ 图形渲染代码,或者如何在学术上推导矩阵乘法。

这门微专栏与众不同。它是专为后端/软件工程师打造的“白盒化” GPU 入门课程。

我们不教图形渲染,不深究复杂的 C++ 语法。我们将直接切入大模型推理的痛点,带你一步步从物理架构走到前沿的 AI 工程技术。

  • 如果你想吃透热门技术: 我们将为你讲透 FlashAttention、PagedAttention (vLLM)、模型量化背后的物理原理。你会发现,这些看似高深的技术,本质上都是在和“内存墙”做斗争。
  • 如果你追求实战落地: 我们不仅教你看懂硬件,还会教你用 Profiling 工具(性能分析器)像侦探一样排查慢查询;作为加餐,我们甚至会教你如何用纯 Go 语言(Zero CGO)直接点火发射 CUDA 内核!

课程目录全景图

为了让你对这趟旅程有一个清晰的预期,以下是本专栏的完整地图:

第一阶段:硬件心智模型
* 第 01 讲 | 硬件解剖:为什么 CPU 是“法拉利”,GPU 是“大巴车”?(含 5090 vs H100 对比)
* 第 02 讲 | 内存金字塔:HBM、SRAM 与不可逾越的“内存墙”

第二阶段:编程模型与工具链
* 第 03 讲 | CUDA 编程模型:指挥“千军万马”的线程艺术
* 第 04 讲 | 性能侦探:性能侦探:拆解 Hello World Kernel 与 Profiling 实战

第三阶段:AI 工程进阶
* 第 05 讲 | 显存管理革命:从 KV Cache 到 PagedAttention (vLLM)
* 第 06 讲 | 算子融合魔法:FlashAttention 的底层原理
* 第 07 讲 | 精度与量化:精度与量化:INT8/FP8 为什么既快又省?
* 第 08 讲 | 分布式推理:Tensor Parallelism (TP) 与通信墙
* 第 09 讲 | 终极指南:如何科学计算 AI 算力需求与硬件选型?

特别加餐:Gopher 的专属浪漫
* 第 10 讲 | 加餐:Go 语言的 GPU 编程——Gopher 的逆袭

小结

在算力的装备竞赛里,最锋利的武器未必是更昂贵的芯片,而是深刻理解软硬件边界的人。

正如谷歌 TurboQuant 证明的那样:懂底层的工程师,只需改写一行底层逻辑,就可能撬动万亿级别的市场价值。

算力时代,不要只做“调包”的局外人。

准备好跨越 CPU 的舒适区,跟我一起深入算力的硅基心脏了吗?

点击这里或扫描下方二维码,开启你的GPU与AI推理工程的入门之旅:

我将在第一讲等你。


还在为“复制粘贴喂AI”而烦恼?我的新专栏 AI原生开发工作流实战 将带你:

  • 告别低效,重塑开发范式
  • 驾驭AI Agent(Claude Code),实现工作流自动化
  • 从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码,开启你的AI原生开发之旅。


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 从 0 开始构建 Agent Harness Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com
这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats