分类 技术志 下的文章

NVIDIA 的颠覆性观点:AI Agent 的未来,属于小模型 (SLM)

本文永久链接 – https://tonybai.com/2025/07/04/slm-is-the-future-of-agentic-ai

大家好,我是Tony Bai。

在 AI 的世界里,“越大越好”似乎已经成为一种颠扑不破的信仰。我们见证了参数量从数十亿飙升至万亿,也习惯了将最强大的通用大语言模型(LLM)视为驱动一切 AI 应用的核心引擎。

然而,就在这股追逐“巨无霸”模型的浪潮之巅,全球 AI 硬件的领导者 NVIDIA,其研究部门却发表了一篇重磅论文,提出了一个看似反直觉,却可能重塑行业的颠覆性观点:

AI Agent 的未来,不属于大模型,而属于小模型 (Small Language Models, SLM)。

这不仅仅是一次技术路线的争鸣,更可能预示着 AI Agent 领域一次深刻的架构范式革命。

现状:“大模型单体”的困境

首先,让我们看看当前大多数 AI Agent 的工作模式:它们的核心通常依赖于对少数几个通用 LLM(如 GPT-o3、Claude 4、gemini 2.5 pro 等)的 API 调用。这个 LLM 就像一个无所不能的大脑,负责理解用户意图、进行推理、调用工具、生成代码等所有智能任务。

这种架构虽然在初期能快速验证想法,但其弊端也日益凸显:
* 成本高昂: 每一次 API 调用都在燃烧真金白银。
* 延迟不可控: 依赖中心化的云服务,难以满足实时性要求。
* 功能浪费: 大多数 Agent 子任务(如格式转换、意图识别)其实非常简单、重复,用一个“通才” LLM 去做,无异于“杀鸡用牛刀”。

这种过度依赖单一、强大、通用模型的模式,与软件工程发展史上我们早已熟悉的“单体应用 (Monolith)”何其相似!

NVIDIA 的三大核心论据:为什么是 SLM?

NVIDIA 的论文从三个维度,系统性地论证了为什么 SLM 才是 AI Agent 的未来。

1. SLM 已足够强大

“小模型性能不行”早已是过时的观念。论文引用了大量最新研究(如 Microsoft 的 Phi 系列、NVIDIA 自家的 Nemotron-H 等)证明,现代的、经过精心设计的 SLM,在推理、代码生成、指令遵循等 Agent 关键能力上,已经可以媲美甚至超越比它们大几十上百倍的 LLM。“小”不再意味着“弱”。

2. SLM 天然更适合

AI Agent 的大部分内部工作流,并非开放式的聊天,而是范围狭窄、格式严格的机器间交互。比如,将用户请求转换为一个 JSON 格式的 API 调用。对于这类任务,SLM 的优势是压倒性的:
* 高效可预测: 低延迟、低资源消耗。
* 行为对齐更容易: 更容易通过微调,让其严格遵守特定的输出格式,减少“幻觉”。
通用 LLM 的广博知识和对话能力,在这些场景下反而成了不必要的累赘。

3. SLM 必然更经济

这是最致命的一击。论文指出,一个 7B 参数的 SLM,其推理成本(在延迟、能耗、算力上)通常比 70B-175B 的 LLM 便宜 10 到 30 倍!不仅如此,SLM 的微调也极其敏捷,可以在几小时内完成,而不是 LLM 所需的数周。这种经济性和灵活性,使得在边缘设备上部署、快速迭代和大规模应用成为可能。

新架构范式:从“大模型单体”到“小模型微服务”

如果接受了 SLM 的巨大优势,那么一个全新的、更优雅的 AI Agent 架构就浮出水面了。这正是我们从“架构角度”想要阐述的,我们可以将其类比为软件工程中从“单体”到“微服务”的伟大演进。

告别“万能”的大模型,拥抱“乐高式”的 AI Agent 新架构:

在这个新范式中,一个复杂的 AI Agent 不再由一个“全能大脑”驱动,而是由一个异构模型系统 (Heterogeneous System) 协同工作:

  • 专家 SLM (Expert SLMs) -> 专职微服务:
    每一个 SLM 都被微调成一个特定领域的专家,负责一项高度专一的任务。比如:

    • SLM_Intent_Classifier:专门负责解析用户意图。
    • SLM_Code_Generator:专门负责生成特定语言和格式的代码片段。
    • SLM_JSON_Extractor:专门负责从非结构化文本中提取 JSON 数据。
      这些“模型微服务”小巧、高效、可独立部署和迭代。
  • 通用 LLM (Generalist LLM) -> API 网关 / 服务编排器:
    昂贵而强大的 LLM 不再处理所有请求,而是被用在刀刃上。它扮演两个关键角色:

    • 用户入口:处理最前端的、开放域的自然语言对话。
    • 复杂任务调度员:当遇到需要跨领域通用知识或复杂推理的罕见任务时,才被调用。
  • Agent 控制器 (Controller) -> 智能路由:
    Agent 的核心逻辑现在变成了一个轻量级的控制器,它的主要职责是根据任务类型,将请求精准地路由到最合适的“模型服务”(某个 SLM 或 LLM)上。

这种“模型即服务”、“模型即组件”的架构,其优势显而易见:

  • 灵活性与组合性: 像搭乐高一样,按需组合不同的专家 SLM,构建功能强大的 Agent。
  • 成本效益: 绝大多数请求由廉价的 SLM 处理,整体运营成本急剧下降。
  • 高可用与容错: 单个 SLM 服务出现问题,不影响整个 Agent 的其他功能。
  • 快速迭代: 可以快速地为某个新功能训练一个新的 SLM,并将其作为新服务加入系统,而无需改动庞大的主体。

结论:未来已来,Agent 的进化之路

NVIDIA 的这篇论文,为我们描绘了一幅清晰的未来图景:AI Agent 的发展,将遵循软件工程的经典演进规律,从笨重、昂贵的“大模型单体”,走向灵活、高效、经济的“小模型微服务”架构。

这标志着 AI 工程化正在从“炼金术”般的模型崇拜,转向更成熟、更可持续的系统设计思维。 未来的核心竞争力,或许不再是谁能调用最强的 LLM,而是谁能更高效地编排一个由众多专家 SLM 组成的“模型军团”。

对于所有 AI 领域的从业者来说,这不仅是一个需要关注的技术趋势,更是一次思维模式的升级。是时候重新审视我们对“智能”的定义,开始构建真正“小而美”的未来了。

论文地址:https://arxiv.org/abs/2506.02153


你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

Twitch工程师的Go进阶之路:为何你写的Go代码,总感觉“不对劲”?

本文永久链接 – https://tonybai.com/2025/07/04/everything-i-did-to-become-an-expert-in-golang

大家好,我是Tony Bai。

你是否也有过这样的时刻?

你已经用 Go 写了不少代码,项目也能跑起来,但内心深处总有一种挥之不去的“别扭感”。你写的 Go 代码,看起来更像是“带有 Go 语法的 Java/Python”,充斥着你从旧语言带来的思维习惯。代码或许能工作,但它不优雅,不简洁,总感觉“不对劲”。

最近,Twitch 的一位资深机器学习工程师 Melkey 分享了他从 Go 小白成长为生产级系统开发者的心路历程。他的故事,完美地诠释了如何突破这个瓶颈,完成从“会写”到“写好”Go 的关键一跃。

在这篇文章中,我们就来解读一下这位工程师的Go专家之路,看看从中可以借鉴到哪些有意义的方法。

从“被迫营业”到“感觉不对”的困境

和许多人一样,Melkey 开始学习 Go 并非出于热爱,而是因为工作的“逼迫”。2021年,当他以初级工程师的身份加入 Twitch 时,他还是一个习惯于用 Python 写脚本的“简单小子”,对 Go 一无所知。为了保住这份改变人生的工作,他别无选择,只能硬着头皮学下去。

很快,他熟悉了指针、静态类型和 Go 的基本语法。但问题也随之而来:他感觉自己的 Go 水平停滞不前,写出的代码“干巴巴的”,缺乏神韵。 他只是在完成任务,却丝毫没有感受到这门语言的魅力,更谈不上建立起真正的理解和喜爱。

这正是许多 Gopher,尤其是从其他语言转来的开发者,都会遇到的困境:我们只是在用 Go 的语法,实现其他语言的逻辑。 我们还没有真正进入 Go 的世界。

“顿悟”时刻:《Effective Go》带来的思维重塑

改变发生在 Melkey 偶然读到 Go 官方文档中的一篇文章——Effective Go 的那一刻。这篇文章里的几段话,像一道闪电,瞬间击穿了他的迷茫:

“A straightforward translation of a C++ or Java program into Go is unlikely to produce a satisfactory result—Java programs are written in Java, not Go.

In other words, to write Go well, it’s important to understand its properties and idioms. It’s also important to know the established conventions for programming in Go… so that programs you write will be easy for other Go programmers to understand.”

这段话的核心思想振聋发聩:将 C++ 或 Java 程序直接翻译成 Go,不可能得到令人满意的结果。要想写好 Go,就必须理解它的特性和惯用法。

Melkey 恍然大悟:他之前所做的,正是这种“直接翻译”的笨拙工作。他缺少的,是一次彻底的“思维重塑”——停止用过去的经验来套用 Go,而是开始真正地用 Go 的思维方式去思考问题。

什么是“Go 的思维方式”?

那么,这种听起来有些玄乎的“Go 思维”究竟是什么?它不是什么神秘的魔法,而是植根于 Go 语言设计中的一系列核心哲学:

1. 崇尚简洁与可读性

Go 厌恶“魔法”。它倾向于用清晰、直白、甚至略显“笨拙”的代码,来换取长期的可读性和可维护性。相比于某些语言中炫技式的语法糖和复杂的隐式行为,Go 鼓励你把事情的来龙去脉写得一清二楚。

2. 组合优于继承

Go 没有类和继承。它通过接口(interface)实现多态,通过结构体嵌入(struct embedding)实现组合。这种方式鼓励开发者构建小而专注的组件,然后像搭乐高一样将它们组合起来,而不是构建庞大而僵硬的继承树。

3. 显式错误处理

if err != nil 是 Go 中最常见也最富争议的代码。但它恰恰体现了 Go 的哲学:错误是程序中正常且重要的一部分,必须被显式地处理,而不是通过 try-catch 这样的语法结构被隐藏起来。它强迫你直面每一个可能出错的地方。

4. 并发是语言的一等公民

Goroutine 和 Channel 不仅仅是两个原生语法元素,它们是一种构建程序的新范式。正如 Rob Pike 所言,“并发不是并行”。Go 鼓励你从设计的源头,就把程序看作是一组通过通信来协作的、独立的并发单元,而不是在写完一堆顺序代码后,再思考如何用线程池去“并行化”它。

从理论到实践:用项目和资源内化新思维

当然,仅仅理解了这些哲学还远远不够。Melkey 强调,在读完所有文档后,他意识到“阅读所能做的就这么多了”,必须将新学到的思想付诸实践。

理论的顿悟,必须通过刻意的项目练习来巩固和内化。下面,就是他亲身走过的、从入门到精通的“四步实战路径”,以及在这条路上为他保驾护航的“精选资源清单”。

一条清晰的实战路径:用四类项目锤炼 Go 思维

  • 第一站:HTTP 服务 (从简单到复杂)

这是 Go 最核心的应用场景,也是梦开始的地方。从最基础的 CRUD、健康检查 API 入手,逐步深入到 OAuth 认证、自定义中间件、利用 context 包进行请求范围内的值传递等。这个过程能让你全面掌握构建生产级 Web 后端所需的各项技能。

  • 第二站:CLI 工具

许多优秀的 Go 开源项目,如 Docker、Kubectl,都是强大的 CLI 工具。通过使用 Cobra、Bubble T 等流行库,去构建自己的命令行应用,你会深刻理解 Go 作为“云原生时代的 C 语言”的工具属性,并学会如何优雅地处理命令行参数、标志和应用状态。

  • 第三站:gRPC 服务

当你感觉 HTTP 服务已驾轻就熟时,就该迈向微服务了。学习 gRPC 和 Protocol Buffers,构建服务间的通信。这将迫使你的思维从处理“用户-服务器”交互,转变为处理“服务-服务”间的交互,是成为分布式系统架构师的关键一步。

  • 第四站:管道作业与脚本

真正的精通,是把一门语言用成“肌肉记忆”。尝试用 Go 替代你过去的脚本语言(如 Python),去编写一些数据处理的管道作业或日常运维脚本,比如批量清洗数据库中的脏数据。这会极大提升你对 Go 标准库的熟练度,让它成为你工具箱里最顺手的那一把。

注:Melkey是机器学习工程师,因为他的第四站中,更多是数据处理相关的实战路径。

良师益友:来自一线的精选资源清单

在这条充满挑战的实践之路上,你不是一个人在战斗。Melkey 也分享了那些曾给予他巨大帮助的“良师益友”。这份清单的宝贵之处在于,它经过了生产一线工程师的真实筛选:

  • Web 后端实战圣经:《Let’s Go Further》 by Alex Edwards

这本书被誉为 Go Web 开发的经典之作。即便时隔数年,其中的原则和实践依然极具价值。我也极力推荐这本书,Alex 的代码风格非常清晰,对初学者极其友好,能帮你打下坚实的基础。

  • 测试驱动开发双璧:《Learn Go with Tests》 & 《Writing an Interpreter in Go》

前者是优秀的在线教程,手把手教你如何通过测试来学习 Go。后者则通过编写一个解释器的过程,让你在实践中深刻理解测试驱动开发(TDD)的精髓。它们不仅教测试,更在教 Go 语言本身。

  • 避坑与最佳实践指南:《100 Go Mistakes and How to Avoid Them》

这是一本能让你快速提升代码质量的“速查手册”。通过学习别人踩过的坑,你可以少走很多弯路,写出更地道、更健壮的 Go 代码。

小结:真正的精通,是一场思维的迁徙

Melkey 的故事告诉我们,精通一门编程语言,从来都不只是学习语法和 API 那么简单。它更像是一场思维的迁徙——你必须愿意放下过去的地图,学习新大陆的规则和文化,并最终成为这片土地上地道的“原住民”

如果你也感觉自己写的 Go 代码“不对劲”,不妨停下来,问问自己:我是在用 Go 的方式思考,还是在用过去的经验翻译?

或许,你的“顿悟”时刻,也正隐藏在重读一遍《Effective Go》的字里行间,或是开启下一个实战项目的决心之中。

你是否也有过类似的“顿悟”时刻?又是哪篇文章、哪个项目或哪位导师,帮助你完成了 Go 思维的重塑?欢迎在评论区分享你的故事。

资料地址:https://www.youtube.com/watch?v=wr8gJMj3ODw


你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats