本文永久链接 – https://tonybai.com/2026/04/21/why-we-are-building-agent-harness-from-scratch

大家好,我是Tony Bai。

今天想和大家分享一个好消息:我筹备已久的极客时间专栏 从0 开始构建 Agent Harness 于昨日(2026.4.20)正式上架了。

在这个各种 AI 应用框架满天飞、“几行 Python 代码就能跑起一个智能体”的时代,很多朋友可能会问:“Tony,大家都在用现成且免费的轮子,你为什么还要花这么大的精力,甚至专门开一个 24 讲的专栏,带着大家用 Go 语言从零去手写一个底层的 Agent Harness 引擎?”

借着专栏上架的机会,我想和大家聊聊,我是如何看待当前 AI 应用开发的,以及为什么我坚定地认为,现在是时候撕开框架的黑盒,回归底层的 Harness(驾驭工程)了。

拐点已至:被框架掩盖的“失控”

如果你在一年多前开发过 AI Agent,你大概率深度使用过 LangChain、AutoGen 等框架。在那个大模型(如 GPT-3.5 时代)推理能力还比较薄弱的时期,我们需要框架来帮模型做意图路由、做任务拆解,框架扮演的是一个“事无巨细的微管家”。

但现在的技术发展,已经到了一个明确的“拐点”。

随着 Claude Sonnet 4.6/Opus 4.7、GPT-5.4、Gemini 3.1 Pro 等前沿模型的问世,模型原生已经具备了极其恐怖的逻辑规划和工具调用(Function Calling)能力。这时候,如果你尝试把基于传统框架拼接出来的 Agent 投入到真实的生产环境(比如让它去排查线上日志、或者做复杂的代码重构),问题往往接踵而至:

  • 上下文雪崩:Agent 读取了一个 3000 行的日志文件,框架没有任何底层的内存压缩机制,大模型 API 直接抛出 400 Token limit exceeded,任务当场中断。
  • 陷入死循环:Agent 遇到一个顽固的报错,连续 10 次执行了错误的 bash 命令,毫无察觉地在原地打转,直到把你的账户余额耗尽。
  • 失控的破坏力:你赋予了它执行本地 Shell 的权限,但在某次幻觉中,它试图执行不可逆的删除操作,而底层的框架根本没有提供可靠的挂起拦截机制。

这些令人“绝望”的瞬间让我意识到:单纯靠堆砌 Prompt 或者调用更高层级的应用框架,是永远无法构建出工业级 Agent 的。我们把最核心的控制权统统交给了不可见的黑盒。

什么是 Harness?为什么要独立研究它?

在剖析了近期震撼业界的顶级原生智能体(如 Claude Code、开源神作 OpenClaw、以及自带进化能力的 Hermes等)的工作机制后,我看到了一个不可逆转的趋势:

传统的框架层正在加速坍塌,作为独立工程研究的 Harness(驾驭工程)正在全面崛起。

什么是 Harness?简单来说,如果把大模型比作 CPU,把上下文(Context Window)比作极其昂贵的内存,那么 Harness 就是为这个 CPU 打造的微型操作系统(OS)。

Harness 不去干涉大模型的思考,它的核心职责极其底层且硬核:

  • 如何在濒临 OOM(内存溢出)的边缘,像垃圾回收器一样优雅地进行上下文阶梯压缩?
  • 如何在 Agent 陷入死循环时,像系统级中断一样注入强提醒,拉回它的注意力?
  • 如何在它试图执行高危命令前,挂起底层的协程,等待人类在飞书里的审批?
  • … …

我花这么大的精力带大家手写 Harness,就是因为现在的难点,早就不是“怎么让大模型输出 JSON”,而是“怎么在物理层面驾驭大模型的破坏力与失控”。

AI 应用的新阶段:Agent 正在成为一类完整的 Application

当我们拥有了一个健壮的 Harness 之后,我们对 AI 应用的认知也会随之重塑。

以前,AI 只是应用里的一个 Feature(功能),比如挂在网页右下角的一个聊天框。

但今天,当你把一个配置了特定 System Prompt 和专属 Skills(技能 SOP)的 Harness 引擎,丢进某一个特定的业务目录里运行时,这个 Agent 本身,就成了一个完整的 Application。

当然,AI 应用的形态是多元的,Agent 并非唯一的范式——AI 作为功能模块嵌入传统产品的场景依然大量存在。

但对于那些以自主完成复杂任务为核心价值的应用而言,”AI App = AI Agent”这个等式正在越来越多的场景下成立。我们不再是写满是 CRUD 的业务代码,我们是在为不同形态的智能体(如:编码Agent、自动化运维 Agent、自动化 CR 助手等)编写底层”物理定律”。

极简哲学:为什么手写能带来认知跃迁?

相较于一两年前的开发模式,今天顶尖的 Agent 项目展现出了一种令人拍案叫绝的“返璞归真”。

以 OpenClaw 为代表的新一代驾驭工程,抛弃了复杂:

  • 最简工具法则:不再堆砌几十个专用 API 导致上下文膨胀,只给模型暴露 Read、Write、Edit 和 Bash 等基础原语工具。让大模型用自然语言去驱动底层的操作系统。
  • 状态外部化:彻底抛弃内存里人类不可读的复杂状态机。强制大模型把宏观计划写在 PLAN.md 里,把微观进度写在 TODO.md 里。把每天的记忆变成了普通的文本文件,不仅实现了零成本的断电续传,更让人类可以随时在 IDE 里修改文件,实现最优雅的人机协同(Human-in-the-loop)。
  • … …

如果你不亲自手写一遍这个引擎,你永远只能在外围惊叹这些设计,而无法将其转化为自己解决复杂业务问题的武器。

专栏的策划:从骨架到全息监控

为了把这些前沿的理念落地,我没有选择纸上谈兵。我决定带着大家用 Go 语言(云原生时代构建基础设施的最佳语言),手敲一个名为 go-tiny-claw 的工业级引擎。

我们的旅程不走捷径,专栏规划了极具层次感的 24 讲大纲:

细心的朋友会发现,除了核心引擎和工具链,我在专栏的后期(模块五),花了不小的篇幅去写 成本追踪(Cost Tracker)链路回放(Tracing)自动化跑分(Benchmark)

之所以加入这些章节,是出于对 AI Agent 工程化落地 的深切体悟。

在企业里,如果一个智能体没有“仪表盘”,你连它跑一次花了多少美金都不知道;如果没有 Tracing 的 JSON 树,当任务在半夜崩溃时,你面对满屏黑盒日志根本无从 Debug;如果没有自动化的 Benchmark,你改了一行提示词,都不知道系统是变聪明了还是变笨了。

把玄学变成工程学,这是从“玩具”走向“工业级”的必经之路。

抛砖引玉:拥抱前沿,共同进化

坦白地说,Harness Engineering(驾驭工程)是一个极其前沿、且目前在业界依然处于野蛮生长和快速迭代的阶段。

无论是开源的 OpenClaw 和 Hermes ,还是Claude Code 的非官方流出,又或是学术界的最新研究论文,都在不断刷新着我们对 Harness 架构的认知上限。

这个专栏定位是 Agent Harness 的概念入门与环环相扣的底层实战。专栏里的每一讲(比如基于双重降级的上下文掩码压缩、或者是错误自愈模板的注入),其实都值得单独抽出来,作为更深入的课题去研究。

我就算是为大家“抛砖引玉”了。

以专栏中提到的 “Session Context 阶梯压缩” 为例。在专栏里,为了保持架构的极简易懂,我们采用了高效的字符级“远期全量掩码”与“近期掐头去尾截断”策略。

但这远非终点。

大家在学习后,完全可以去查阅 Claude Code 源码中更多层级的上下文折叠思路,或者探索多智能体(Multi-Agent)在 Harness 层的更优调度解法。

如果在未来业界出现了颠覆性的架构理论,我也会以“加餐”的形式在专栏中及时跟进。

邀请你加入这场“造轮子”的旅程

未来已来,它就藏在那些最底层的代码和极简的架构哲学中。

只有亲自造过轮子的人,才知道车辆在高速过弯时,底盘的极限到底在哪里。如果你也不满足于做大模型时代的“调包侠”,如果你也渴望掌控代码的绝对执行权,欢迎加入我的新专栏。

点击这里或扫描下方二维码,亲自打造属于你的工业级智能体引擎。

感谢大家一直以来的支持。我们,专栏里见!


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

© 2026, bigwhite. 版权所有.

Related posts:

  1. 输入需求,输出系统:AI Agent 正在实现软件工程的“终极梦想” —— 软件工厂!
  2. 手工作坊的终结:为什么你必须把 Agent Skills 开发,变成严谨的软件工程?
  3. Rust 输了?在 AI Agent 的战场上,TypeScript 才是唯一的“神”
  4. 告别单打独斗!Claude Code 全新“Agent Team”模式:当 AI 开始组队干活
  5. 你的 AI Agent 为何总“犯傻”?构建生产级 Agent 所需的6大工程原则