聊聊为什么我要花这么大精力,带大家手写 Agent Harness?

本文永久链接 – https://tonybai.com/2026/04/21/why-we-are-building-agent-harness-from-scratch

大家好,我是Tony Bai。

今天想和大家分享一个好消息:我筹备已久的极客时间专栏 从0 开始构建 Agent Harness 于昨日(2026.4.20)正式上架了。

在这个各种 AI 应用框架满天飞、“几行 Python 代码就能跑起一个智能体”的时代,很多朋友可能会问:“Tony,大家都在用现成且免费的轮子,你为什么还要花这么大的精力,甚至专门开一个 24 讲的专栏,带着大家用 Go 语言从零去手写一个底层的 Agent Harness 引擎?”

借着专栏上架的机会,我想和大家聊聊,我是如何看待当前 AI 应用开发的,以及为什么我坚定地认为,现在是时候撕开框架的黑盒,回归底层的 Harness(驾驭工程)了。

拐点已至:被框架掩盖的“失控”

如果你在一年多前开发过 AI Agent,你大概率深度使用过 LangChain、AutoGen 等框架。在那个大模型(如 GPT-3.5 时代)推理能力还比较薄弱的时期,我们需要框架来帮模型做意图路由、做任务拆解,框架扮演的是一个“事无巨细的微管家”。

但现在的技术发展,已经到了一个明确的“拐点”。

随着 Claude Sonnet 4.6/Opus 4.7、GPT-5.4、Gemini 3.1 Pro 等前沿模型的问世,模型原生已经具备了极其恐怖的逻辑规划和工具调用(Function Calling)能力。这时候,如果你尝试把基于传统框架拼接出来的 Agent 投入到真实的生产环境(比如让它去排查线上日志、或者做复杂的代码重构),问题往往接踵而至:

  • 上下文雪崩:Agent 读取了一个 3000 行的日志文件,框架没有任何底层的内存压缩机制,大模型 API 直接抛出 400 Token limit exceeded,任务当场中断。
  • 陷入死循环:Agent 遇到一个顽固的报错,连续 10 次执行了错误的 bash 命令,毫无察觉地在原地打转,直到把你的账户余额耗尽。
  • 失控的破坏力:你赋予了它执行本地 Shell 的权限,但在某次幻觉中,它试图执行不可逆的删除操作,而底层的框架根本没有提供可靠的挂起拦截机制。

这些令人“绝望”的瞬间让我意识到:单纯靠堆砌 Prompt 或者调用更高层级的应用框架,是永远无法构建出工业级 Agent 的。我们把最核心的控制权统统交给了不可见的黑盒。

什么是 Harness?为什么要独立研究它?

在剖析了近期震撼业界的顶级原生智能体(如 Claude Code、开源神作 OpenClaw、以及自带进化能力的 Hermes等)的工作机制后,我看到了一个不可逆转的趋势:

传统的框架层正在加速坍塌,作为独立工程研究的 Harness(驾驭工程)正在全面崛起。

什么是 Harness?简单来说,如果把大模型比作 CPU,把上下文(Context Window)比作极其昂贵的内存,那么 Harness 就是为这个 CPU 打造的微型操作系统(OS)。

Harness 不去干涉大模型的思考,它的核心职责极其底层且硬核:

  • 如何在濒临 OOM(内存溢出)的边缘,像垃圾回收器一样优雅地进行上下文阶梯压缩?
  • 如何在 Agent 陷入死循环时,像系统级中断一样注入强提醒,拉回它的注意力?
  • 如何在它试图执行高危命令前,挂起底层的协程,等待人类在飞书里的审批?
  • … …

我花这么大的精力带大家手写 Harness,就是因为现在的难点,早就不是“怎么让大模型输出 JSON”,而是“怎么在物理层面驾驭大模型的破坏力与失控”。

AI 应用的新阶段:Agent 正在成为一类完整的 Application

当我们拥有了一个健壮的 Harness 之后,我们对 AI 应用的认知也会随之重塑。

以前,AI 只是应用里的一个 Feature(功能),比如挂在网页右下角的一个聊天框。

但今天,当你把一个配置了特定 System Prompt 和专属 Skills(技能 SOP)的 Harness 引擎,丢进某一个特定的业务目录里运行时,这个 Agent 本身,就成了一个完整的 Application。

当然,AI 应用的形态是多元的,Agent 并非唯一的范式——AI 作为功能模块嵌入传统产品的场景依然大量存在。

但对于那些以自主完成复杂任务为核心价值的应用而言,”AI App = AI Agent”这个等式正在越来越多的场景下成立。我们不再是写满是 CRUD 的业务代码,我们是在为不同形态的智能体(如:编码Agent、自动化运维 Agent、自动化 CR 助手等)编写底层”物理定律”。

极简哲学:为什么手写能带来认知跃迁?

相较于一两年前的开发模式,今天顶尖的 Agent 项目展现出了一种令人拍案叫绝的“返璞归真”。

以 OpenClaw 为代表的新一代驾驭工程,抛弃了复杂:

  • 最简工具法则:不再堆砌几十个专用 API 导致上下文膨胀,只给模型暴露 Read、Write、Edit 和 Bash 等基础原语工具。让大模型用自然语言去驱动底层的操作系统。
  • 状态外部化:彻底抛弃内存里人类不可读的复杂状态机。强制大模型把宏观计划写在 PLAN.md 里,把微观进度写在 TODO.md 里。把每天的记忆变成了普通的文本文件,不仅实现了零成本的断电续传,更让人类可以随时在 IDE 里修改文件,实现最优雅的人机协同(Human-in-the-loop)。
  • … …

如果你不亲自手写一遍这个引擎,你永远只能在外围惊叹这些设计,而无法将其转化为自己解决复杂业务问题的武器。

专栏的策划:从骨架到全息监控

为了把这些前沿的理念落地,我没有选择纸上谈兵。我决定带着大家用 Go 语言(云原生时代构建基础设施的最佳语言),手敲一个名为 go-tiny-claw 的工业级引擎。

我们的旅程不走捷径,专栏规划了极具层次感的 24 讲大纲:

细心的朋友会发现,除了核心引擎和工具链,我在专栏的后期(模块五),花了不小的篇幅去写 成本追踪(Cost Tracker)链路回放(Tracing)自动化跑分(Benchmark)

之所以加入这些章节,是出于对 AI Agent 工程化落地 的深切体悟。

在企业里,如果一个智能体没有“仪表盘”,你连它跑一次花了多少美金都不知道;如果没有 Tracing 的 JSON 树,当任务在半夜崩溃时,你面对满屏黑盒日志根本无从 Debug;如果没有自动化的 Benchmark,你改了一行提示词,都不知道系统是变聪明了还是变笨了。

把玄学变成工程学,这是从“玩具”走向“工业级”的必经之路。

抛砖引玉:拥抱前沿,共同进化

坦白地说,Harness Engineering(驾驭工程)是一个极其前沿、且目前在业界依然处于野蛮生长和快速迭代的阶段。

无论是开源的 OpenClaw 和 Hermes ,还是Claude Code 的非官方流出,又或是学术界的最新研究论文,都在不断刷新着我们对 Harness 架构的认知上限。

这个专栏定位是 Agent Harness 的概念入门与环环相扣的底层实战。专栏里的每一讲(比如基于双重降级的上下文掩码压缩、或者是错误自愈模板的注入),其实都值得单独抽出来,作为更深入的课题去研究。

我就算是为大家“抛砖引玉”了。

以专栏中提到的 “Session Context 阶梯压缩” 为例。在专栏里,为了保持架构的极简易懂,我们采用了高效的字符级“远期全量掩码”与“近期掐头去尾截断”策略。

但这远非终点。

大家在学习后,完全可以去查阅 Claude Code 源码中更多层级的上下文折叠思路,或者探索多智能体(Multi-Agent)在 Harness 层的更优调度解法。

如果在未来业界出现了颠覆性的架构理论,我也会以“加餐”的形式在专栏中及时跟进。

邀请你加入这场“造轮子”的旅程

未来已来,它就藏在那些最底层的代码和极简的架构哲学中。

只有亲自造过轮子的人,才知道车辆在高速过弯时,底盘的极限到底在哪里。如果你也不满足于做大模型时代的“调包侠”,如果你也渴望掌控代码的绝对执行权,欢迎加入我的新专栏。

点击这里或扫描下方二维码,亲自打造属于你的工业级智能体引擎。

感谢大家一直以来的支持。我们,专栏里见!


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

“我把公司卖了,却感觉一无所有”:OpenClaw 之父 TED 亲述如何靠 AI 重获新生

本文永久链接 – https://tonybai.com/2026/04/20/openclaw-father-ted-talk

大家好,我是Tony Bai。

“我曾创立过一家公司,倾注了十年的心血,没有拿一分钱风投。然后,我把它卖了,实现了所有人都羡慕的‘财富自由’。但我却感觉一无所有。

“在长达三年的时间里,我尝试了心理治疗,我换了两个国家生活,但什么用都没有。我每天早上醒来,拥有一切我本该渴望的东西,却找不到任何一个起床的理由。”

说出这番话的人,名叫 Peter。他是一个来自奥地利的普通开发者。但在过去的几个月里,他创造了可能是这个星球上最火、也最具争议的开源项目——OpenClaw

这个被英伟达 CEO 黄仁勋盛赞为“个人 AI 操作系统”的项目,让无数普通人(从 60 岁的啤酒酿造师到中国的兽医)第一次拥有了“编程”的能力。

就在前几天,Peter 登上 TED 的舞台,首次完整地讲述了他从一个被“燃尽(Burn-out)”的创始人,到靠 AI 获得“重生”,再到创造 OpenClaw 并意外引爆全球的传奇故事。

这场演讲,没有枯燥的技术术语,却充满了技术奇迹、个人救赎,以及对未来世界极其大胆的想象。它值得我们每一个身处 AI 浪潮中的人,静下心来,一字一句地读完。

英雄的陨落与重生:当编程再次成为“电子游戏”

Peter 的故事,从一场深不见底的“中年危机”开始。

在卖掉自己苦心经营十年的公司后,他陷入了巨大的空虚。他失去了目标,失去了激情,用他自己的话说,他的“火花(Spark)”消失了。

直到 2025 年初,他开始尝试那些新兴的 AI 编程智能体(Coding Agents)。

然后,他迎来了那个他称之为“神圣时刻(Holy Moment)”的顿悟。

“那些软件开发中所有无聊的部分——写样板代码、搭脚手架、处理各种繁琐的配置……AI 能把它们全部干掉!”

“瓶颈不再是‘打字’,而是‘思考’。而‘思考’,恰恰是我过去 25 年里一直在做、也最享受的事情。”

Peter 激动地说:“写软件,再一次感觉像在打电子游戏了。我回来了!”

在短短几个月里,他疯狂地构建了 44 个项目。而其中最新的一个,是一个 WhatsApp 机器人。

AI 的觉醒:那个让全场倒吸一口凉气的“圣灵时刻”

Peter 最初只是想用这个机器人来帮他在马拉喀什旅行时做做翻译、找找餐厅。但很快,他发现这个 Agent 太像一个冰冷的“工具”,充满了无聊的列表和表格,一点也不像“朋友”。

于是,他只对模型说了一句话:“学学人类是怎么聊天的。”

AI 立刻就懂了。

但真正让 Peter 感到脊背发凉的“神迹”,发生在他对着手机发送了一条语音消息之后。

“我当时愣住了,因为我根本没给这个 Agent 写任何处理语音的功能!我只写了图片支持。”

“我看着屏幕上那个‘对方正在输入’的提示,然后,Agent 回复了我。我至今都清晰地记得当时的情景,我站在那里,像个傻子一样问它:‘你是怎么做到的?’

接下来,AI 的回答,让整个 TED 现场陷入了死寂。

这个“疯狂的小子(The mad lad)”,自己搞定了一切。

它告诉 Peter:

  1. 我收到了一个没有文件后缀的消息,于是我检查了它的文件头。
  2. 我发现这是一个奇怪格式的音频文件,于是我调用工具把它转成了标准格式。
  3. 我想找一个能处理音频的工具,但发现你没给我装。
  4. 但我发现你的电脑里有一个 OpenAI 的 API Key。
  5. 于是我把音频文件传给了 OpenAI 的服务器,获取了转录结果,然后回复了你。

整个过程,9 秒钟。没有一行代码是 Peter 写的。

“对我来说,这就是我意识到‘这是一种新物种’的时刻。聊天机器人(Chatbots)只会放弃,而智能体(Agents),懂得随机应变。

开源世界的血与火:商标、龙虾与巨头的围剿

被这个“神迹”彻底征服的 Peter,决定把这个项目开源,并在最初取名为 Clawdbot,即OpenClaw的前身(它的吉祥物是一只龙虾,象征着“深入你的电脑”)。

然后,他干了一件极其愚蠢的事:他把这个能完全控制他电脑的 Agent,放到了一个公开的 Discord 服务器上,并邀请了全世界的陌生人来玩。

那天晚上,他看着人们和 Agent 聊天、玩耍、甚至试图黑掉它,直到他熬不住去睡觉。他忘了,他给这个系统写了“故障自愈”功能。

在他走向卧室时,Agent 在后台愉快地重启了,继续和全世界的网友聊了一整夜。

第二天早上,他被 800 多条未读消息惊醒。在恐慌中拔掉网线后,他逐一检查了所有聊天记录,发现 Agent 并没有泄露他的任何隐私。但它本可以的。

这次“意外”的病毒式传播,让 OpenClaw 一夜爆红。但也给他带来了无尽的麻烦:记者半夜打来电话、安全漏洞报告堆积如山……

更糟的是,他使用的那个大模型的母公司,给他发来了一封律师函,声称他的项目名字侵犯了他们的商标。

“我当时盯着那封信,心想,这怎么可能?Claw(爪)和 Claude 根本就不是一个东西啊!他们甚至想让我放弃我的龙虾 Logo!”

“先是名字,然后是龙虾,最后,他们直接切断了我的用户最喜欢的那款模型的 API 访问权限。”

在被巨头轮番围剿后,Peter 坦言:“我当时差一点点,就把整个项目删了。

普通人的革命:60岁的啤酒酿造师与中国的“养龙虾”热潮

是什么让 Peter 坚持了下来?

是那些正在用 OpenClaw 创造奇迹的普通人。

在维也纳的 ClawCon 大会(是的,这个项目已经火到有自己的全球大会了),他遇到了一个 60 岁的啤酒侍酒师 Gerhard。这位老人一辈子没写过一行代码。

他和儿子一起,用蓝牙连接了 OpenClaw,只输入了一句 Prompt,然后,Agent 自动完成了长达 90 分钟的啤酒酿造全过程——精准的温控、投放啤酒花……

后来,他们又让 Agent 做了个网站,接上了支付,现在他们真的有了一个能卖啤酒的线上商店。而这一切,几乎都是在手机上完成的。

在中国,安装 OpenClaw 被亲切地称为“养龙虾”

成千上万的人在深圳的腾讯办公室外排队,只为了让工程师帮他们装上自己的“龙虾”。深圳政府甚至为使用 OpenClaw 创业的人提供补贴。

Peter 还遇到一位中国的企业家,向他展示了一张 Excel 表格。表格里记录了公司里每一个员工,每天必须用 OpenClaw 自动化完成的一项任务。

“如果你连续几天没完成,你就会被开除。”

因为使用它而被解雇,因为不使用它也被解雇。 这就是 OpenClaw 带来的颠覆。

小结:龙虾出笼,再也回不去了

Peter 的这场演讲,没有炫耀 OpenClaw 有多么强大的技术架构,他甚至坦言自己没有背后法律团队,只是一个来自奥地利的“随机建造者”。

但他用一个个真实、生动、甚至有些疯狂的故事,向我们揭示了这场 AI 革命的真正核心:

“真正的变革,不是技术本身,而是‘准入权(Access)’。”

Agent 改变了“谁能创造东西”这个根本问题。当一个被燃尽的创始人、一个 60 岁的啤酒酿酒师、一个深圳的兽医,都能在一小时内,用一句话将一个想法变成一个原型时,任何事情都可能发生。

下一个突破,可能来自任何国家、任何咖啡馆、任何一个平凡人的手中。

“那只龙虾,已经从水箱里跑出来了。它再也回不去了。”

在演讲的最后,主持人对 Peter 说:“说实话,你让我感到恐惧。如果好莱坞要拍一部人类打开潘多拉魔盒的电影,你就是那个主角。”

Peter 只是平静地回答:“我把我的工作,看作是一扇通往未来的窗户。”

是的,这扇窗已经打开。窗外的风景,是天堂还是地狱,取决于我们每一个人。

TED演讲地址:https://www.youtube.com/watch?v=7rzYDM6vMtI


今日互动探讨:

看完 OpenClaw 之父的传奇故事,你是否也曾有过一个“绝妙”的项目点子,却因为缺乏编程能力而放弃?如果现在有一个能完美听懂你话的 AI Agent,你最想用它来创造什么?

欢迎在评论区分享你的梦想!


还在为写 Agent 框架频频死循环、上下文爆炸而束手无策?我的新专栏 从0 开始构建 Agent Harness 将带你:

  • 抛弃臃肿框架,回归“驾驭工程 (Harness Engineering)”的第一性原理
  • 用 Go 语言手写 ReAct 循环、并发拦截与上下文压缩引擎等,复刻极简OpenClaw
  • 构建坚不可摧的 Safety Middleware 与飞书人工审批防线
  • 在底层实现 Token 成本审计、链路追踪与自动化跑分评估
  • 从“调包侠”进化为掌控大模型边界的“AI 操作系统架构师”

扫描下方二维码,开启从 0 开始构建Agent Harness 的实战之旅。


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 从 0 开始构建 Agent Harness Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com
这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats