标签 软件工程 下的文章

聊聊为什么我要花这么大精力,带大家手写 Agent Harness?

本文永久链接 – https://tonybai.com/2026/04/21/why-we-are-building-agent-harness-from-scratch

大家好,我是Tony Bai。

今天想和大家分享一个好消息:我筹备已久的极客时间专栏 从0 开始构建 Agent Harness 于昨日(2026.4.20)正式上架了。

在这个各种 AI 应用框架满天飞、“几行 Python 代码就能跑起一个智能体”的时代,很多朋友可能会问:“Tony,大家都在用现成且免费的轮子,你为什么还要花这么大的精力,甚至专门开一个 24 讲的专栏,带着大家用 Go 语言从零去手写一个底层的 Agent Harness 引擎?”

借着专栏上架的机会,我想和大家聊聊,我是如何看待当前 AI 应用开发的,以及为什么我坚定地认为,现在是时候撕开框架的黑盒,回归底层的 Harness(驾驭工程)了。

拐点已至:被框架掩盖的“失控”

如果你在一年多前开发过 AI Agent,你大概率深度使用过 LangChain、AutoGen 等框架。在那个大模型(如 GPT-3.5 时代)推理能力还比较薄弱的时期,我们需要框架来帮模型做意图路由、做任务拆解,框架扮演的是一个“事无巨细的微管家”。

但现在的技术发展,已经到了一个明确的“拐点”。

随着 Claude Sonnet 4.6/Opus 4.7、GPT-5.4、Gemini 3.1 Pro 等前沿模型的问世,模型原生已经具备了极其恐怖的逻辑规划和工具调用(Function Calling)能力。这时候,如果你尝试把基于传统框架拼接出来的 Agent 投入到真实的生产环境(比如让它去排查线上日志、或者做复杂的代码重构),问题往往接踵而至:

  • 上下文雪崩:Agent 读取了一个 3000 行的日志文件,框架没有任何底层的内存压缩机制,大模型 API 直接抛出 400 Token limit exceeded,任务当场中断。
  • 陷入死循环:Agent 遇到一个顽固的报错,连续 10 次执行了错误的 bash 命令,毫无察觉地在原地打转,直到把你的账户余额耗尽。
  • 失控的破坏力:你赋予了它执行本地 Shell 的权限,但在某次幻觉中,它试图执行不可逆的删除操作,而底层的框架根本没有提供可靠的挂起拦截机制。

这些令人“绝望”的瞬间让我意识到:单纯靠堆砌 Prompt 或者调用更高层级的应用框架,是永远无法构建出工业级 Agent 的。我们把最核心的控制权统统交给了不可见的黑盒。

什么是 Harness?为什么要独立研究它?

在剖析了近期震撼业界的顶级原生智能体(如 Claude Code、开源神作 OpenClaw、以及自带进化能力的 Hermes等)的工作机制后,我看到了一个不可逆转的趋势:

传统的框架层正在加速坍塌,作为独立工程研究的 Harness(驾驭工程)正在全面崛起。

什么是 Harness?简单来说,如果把大模型比作 CPU,把上下文(Context Window)比作极其昂贵的内存,那么 Harness 就是为这个 CPU 打造的微型操作系统(OS)。

Harness 不去干涉大模型的思考,它的核心职责极其底层且硬核:

  • 如何在濒临 OOM(内存溢出)的边缘,像垃圾回收器一样优雅地进行上下文阶梯压缩?
  • 如何在 Agent 陷入死循环时,像系统级中断一样注入强提醒,拉回它的注意力?
  • 如何在它试图执行高危命令前,挂起底层的协程,等待人类在飞书里的审批?
  • … …

我花这么大的精力带大家手写 Harness,就是因为现在的难点,早就不是“怎么让大模型输出 JSON”,而是“怎么在物理层面驾驭大模型的破坏力与失控”。

AI 应用的新阶段:Agent 正在成为一类完整的 Application

当我们拥有了一个健壮的 Harness 之后,我们对 AI 应用的认知也会随之重塑。

以前,AI 只是应用里的一个 Feature(功能),比如挂在网页右下角的一个聊天框。

但今天,当你把一个配置了特定 System Prompt 和专属 Skills(技能 SOP)的 Harness 引擎,丢进某一个特定的业务目录里运行时,这个 Agent 本身,就成了一个完整的 Application。

当然,AI 应用的形态是多元的,Agent 并非唯一的范式——AI 作为功能模块嵌入传统产品的场景依然大量存在。

但对于那些以自主完成复杂任务为核心价值的应用而言,”AI App = AI Agent”这个等式正在越来越多的场景下成立。我们不再是写满是 CRUD 的业务代码,我们是在为不同形态的智能体(如:编码Agent、自动化运维 Agent、自动化 CR 助手等)编写底层”物理定律”。

极简哲学:为什么手写能带来认知跃迁?

相较于一两年前的开发模式,今天顶尖的 Agent 项目展现出了一种令人拍案叫绝的“返璞归真”。

以 OpenClaw 为代表的新一代驾驭工程,抛弃了复杂:

  • 最简工具法则:不再堆砌几十个专用 API 导致上下文膨胀,只给模型暴露 Read、Write、Edit 和 Bash 等基础原语工具。让大模型用自然语言去驱动底层的操作系统。
  • 状态外部化:彻底抛弃内存里人类不可读的复杂状态机。强制大模型把宏观计划写在 PLAN.md 里,把微观进度写在 TODO.md 里。把每天的记忆变成了普通的文本文件,不仅实现了零成本的断电续传,更让人类可以随时在 IDE 里修改文件,实现最优雅的人机协同(Human-in-the-loop)。
  • … …

如果你不亲自手写一遍这个引擎,你永远只能在外围惊叹这些设计,而无法将其转化为自己解决复杂业务问题的武器。

专栏的策划:从骨架到全息监控

为了把这些前沿的理念落地,我没有选择纸上谈兵。我决定带着大家用 Go 语言(云原生时代构建基础设施的最佳语言),手敲一个名为 go-tiny-claw 的工业级引擎。

我们的旅程不走捷径,专栏规划了极具层次感的 24 讲大纲:

细心的朋友会发现,除了核心引擎和工具链,我在专栏的后期(模块五),花了不小的篇幅去写 成本追踪(Cost Tracker)链路回放(Tracing)自动化跑分(Benchmark)

之所以加入这些章节,是出于对 AI Agent 工程化落地 的深切体悟。

在企业里,如果一个智能体没有“仪表盘”,你连它跑一次花了多少美金都不知道;如果没有 Tracing 的 JSON 树,当任务在半夜崩溃时,你面对满屏黑盒日志根本无从 Debug;如果没有自动化的 Benchmark,你改了一行提示词,都不知道系统是变聪明了还是变笨了。

把玄学变成工程学,这是从“玩具”走向“工业级”的必经之路。

抛砖引玉:拥抱前沿,共同进化

坦白地说,Harness Engineering(驾驭工程)是一个极其前沿、且目前在业界依然处于野蛮生长和快速迭代的阶段。

无论是开源的 OpenClaw 和 Hermes ,还是Claude Code 的非官方流出,又或是学术界的最新研究论文,都在不断刷新着我们对 Harness 架构的认知上限。

这个专栏定位是 Agent Harness 的概念入门与环环相扣的底层实战。专栏里的每一讲(比如基于双重降级的上下文掩码压缩、或者是错误自愈模板的注入),其实都值得单独抽出来,作为更深入的课题去研究。

我就算是为大家“抛砖引玉”了。

以专栏中提到的 “Session Context 阶梯压缩” 为例。在专栏里,为了保持架构的极简易懂,我们采用了高效的字符级“远期全量掩码”与“近期掐头去尾截断”策略。

但这远非终点。

大家在学习后,完全可以去查阅 Claude Code 源码中更多层级的上下文折叠思路,或者探索多智能体(Multi-Agent)在 Harness 层的更优调度解法。

如果在未来业界出现了颠覆性的架构理论,我也会以“加餐”的形式在专栏中及时跟进。

邀请你加入这场“造轮子”的旅程

未来已来,它就藏在那些最底层的代码和极简的架构哲学中。

只有亲自造过轮子的人,才知道车辆在高速过弯时,底盘的极限到底在哪里。如果你也不满足于做大模型时代的“调包侠”,如果你也渴望掌控代码的绝对执行权,欢迎加入我的新专栏。

点击这里或扫描下方二维码,亲自打造属于你的工业级智能体引擎。

感谢大家一直以来的支持。我们,专栏里见!


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

薄驾驭,厚技能:YC 掌门人揭秘拉开 1000 倍效率差距的 AI 工程化心法

本文永久链接 – https://tonybai.com/2026/04/19/thin-harness-fat-skills

大家好,我是Tony Bai。

在过去一年,你有没有想过,为什么同样用着 GPT 或 Claude 等大模型以及Claude Code这样的Coding Agent,有的人生产力只提升了 2 倍,而有的人却能爆发出 100倍、甚至 1000倍 的惊人能量?

就在前几天,硅谷创投界的大佬、Y Combinator 的 CEO Garry Tan,发表了一篇阅读量高达 70万+ 的长文,极其犀利地揭开了这个“效率鸿沟”背后的残酷真相。

他引用了 Google 前员工 Steve Yegge 的一个惊人论断:

“使用 AI 智能体(Agent)的人,比现在用 Cursor 和聊天窗口的人效率高 10-100 倍,比 2005 年的 Google 工程师效率高 1000 倍。”

Garry Tan 写道:“这不是吹牛,我亲眼见过,我亲身经历过。”

他甚至爆出一个猛料:2026 年 3 月 31 日,Anthropic 意外地将 Claude Code 的全部 51.2 万行源码泄露到了 npm 仓库。他读完了。

“这次泄露证实了我在 YC 一直教导的东西:秘密根本不在大模型本身,而在那个包裹着模型的‘驾驭层(Harness)’!

今天,我们就来读读 Garry Tan 这篇文章,看看硅谷最顶尖的玩家,是如何通过 “薄驾驭,厚技能(Thin Harness, Fat Skills)” 的架构哲学,来榨干大模型的每一滴潜能的。

你的“胖驾驭”,正在杀死你的 AI

在文章的开头,Garry Tan 就毫不客气地指出了当下大多数 Agent 框架的“原罪”:臃肿的驾驭层,和孱弱的技能。

我们大多数人是怎么做的?我们给 AI 挂载了 40 多个 Tool Calls,每一个工具都对应一个外部 API。结果就是,光是这些工具的定义,就吃掉了上下文窗口(Context Window)的一半!

大模型每次行动前,都要在几十个工具中艰难地做选择题,不仅推理速度慢得像乌龟,出错率更是高得离谱。

Garry Tan 给出的架构哲学恰恰相反:

推崇“薄驾驭(Thin Harness)”:驾驭层(Harness)只做四件事——循环运行模型、读写文件、管理上下文、执行安全策略。代码量可能只有 200 行。
推崇“厚技能(Fat Skills)”:将所有复杂的业务逻辑、判断力、领域知识,全部封装成一个个可复用、可参数化的 Markdown 文件,即“技能(Skill)”。

“反面教材就是一个臃肿的驾驭层,配上一堆孱弱的技能。……你想要的是专为特定目的打造的、快速且狭窄的工具。”

五大心法:从“写 Prompt”到“编程 AI”

Garry Tan 认为,大模型的瓶颈从来不是智商。它天生就会推理、综合、写代码。它之所以频繁失败,是因为它不理解你的数据、你的规范、你问题的具体形态。

而下面这五个定义,正是修复这个问题的“架构级补丁”,也是“薄驾驭,厚技能”哲学的具体体现。

心法一:技能文件(Skill Files)—— 用 Markdown 写“方法调用”

这是最颠覆认知的一点。Garry Tan 认为,优秀的 Skill 文件,工作起来就像一个函数调用(Method Call)。它接受参数,并且根据不同的参数,产生完全不同的能力。

他举了一个名为 /investigate 的技能为例。这个 Skill 只有 7 个步骤:圈定数据集、构建时间线、标注文档、综合信息、正反方辩论、引用来源。

  • 当你把这个 Skill 指向一个安全科学家的 210 万封邮件,它就变成了一个医学研究分析师
  • 当你把它指向一家空壳公司和 FEC 的文件,它就变成了一个法务调查员

“这根本不是提示词工程。这是软件设计。你用 Markdown 作为编程语言,用人类的判断力作为运行时。”

心法二:解析器(Resolvers)—— AI 的“智能路由表”

技能文件告诉模型“怎么做”,而解析器告诉模型“在什么时候,加载什么上下文”。

Garry Tan 坦白,他自己曾经写过一个长达 20000 行的 CLAUDE.md 文件,里面塞满了各种他遇到过的奇技淫巧。结果导致模型注意力严重下降,甚至 Claude 自己都“告诉”他让他删掉点。

最终的解决方案,是把这个巨大的文件,拆成了一个只有 200 行的“指针”文件,和一个解析器(Resolver)

“当一个开发者改了代码,没有解析器,他直接提交了。有了解析器,模型会先去读取 docs/EVALS.md,这个文件说:先跑评测套件,对比分数,如果准确率下降超过 2%,就回滚并调查。”

解析器就像一个智能的“路由表”,在不污染上下文的情况下,按需加载最精准的知识。

心法三:潜在空间 vs. 确定性—— 别让 AI 做数学题

这是 Agent 设计中最常见的错误:让 AI 去做它不擅长的事。

  • 潜在空间(Latent Space):这是 AI 的主场。它负责阅读、理解、判断、综合、模式识别。
  • 确定性(Deterministic):这是传统代码的主场。SQL 查询、代码编译、数学计算。

“一个 LLM 可以帮你安排 8 个人的晚宴座位,它会考虑每个人的性格和社交关系。但你让它去排 800 个人的座位,它会幻觉出一个看似合理、但完全错误的座位表。因为这是一个确定性的组合优化问题,应该交给传统算法。”

最牛逼的系统,对这条边界的划分是冷酷无情的。

心法四:倾向分析 —— 让 AI 拥有“判断力”

这是让 AI 从“数据库”进化为“分析师”的关键一步。

倾向分析,就是让模型读取关于一个主题的所有信息,然后写出一份结构化的、浓缩了判断力的简介。

Garry Tan 以 YC 内部正在构建的、管理 6000 名创始人的 AI 系统为例:

传统的关键词搜索,根本无法发现一个伪装成“可观测性”工具的 FinOps 项目。

但通过倾向分析,AI 读取了创始人的所有 GitHub 提交、访谈记录、公开帖子后,会给出一个惊人的洞察:

“创始人:Maria Santos。公司:Contrail。声称在做:‘给 AI Agent 用的 Datadog’。实际在做: 80% 的代码都在写账单模块。她其实在做一个伪装成可观测性的 FinOps 工具。”

这种“判断力”,是任何 RAG 管道都无法产生的。模型必须真正地去“阅读”和“思考”。

心法五:技能即永久升级

这是 Garry Tan 架构哲学的最终闭环。

他给自己团队的 AI Agent 下了一条铁命令:

“你绝不被允许做一次性的工作。如果我让你做一件事,而这件事未来可能需要再做一遍,你必须:第一次手动在 3-10 个样本上完成它,把结果给我看。如果我批准了,你就必须把这个过程固化成一个 Skill 文件。如果它应该自动运行,就把它加到定时任务里。测试标准:如果我需要为同一件事第二次开口,你就失败了。”

每一次你写下的 Skill,都是对你的 AI 系统的一次永久性升级。它永不衰退,永不遗忘。当下一代更强的模型发布时,你所有的 Skill 都会在一夜之间变得更聪明。

小结

Garry Tan 的这篇文章,为所有在 AI 时代感到迷茫的开发者,提供了一套极具实操性的架构蓝图。

它告诉我们,当大模型的能力趋于同质化时,真正的护城河,不在于你拥有哪个模型的 API 访问权限,而在于你为这个模型构建了怎样一个高效、智能、且能源源不断自我进化的“外部大脑”。

这个“大脑”,就是你沉淀下来的“厚技能(Fat Skills)”资产。

不要再沉迷于寻找那些能一键生成整个项目的“魔法按钮”了。慢下来,像一个真正的软件设计师一样,去思考你的流程、你的判断、你的领域知识。然后,把它们一一固化成 Markdown。

构建一次,它将永远为你运行。

资料链接:https://x.com/garrytan/status/2042925773300908103


今日互动探讨:

看完 YC 掌门人的这套“薄驾驭,厚技能”心法,你对自己目前开发 Agent 的方式有什么新的反思?你认为用 Markdown 来“编程”AI 的想法,是天才还是异端?

欢迎在评论区分享你的看法!


还在为“复制粘贴喂AI”而烦恼?我的新专栏 AI原生开发工作流实战 将带你:

  • 告别低效,重塑开发范式
  • 驾驭AI Agent(Claude Code),实现工作流自动化
  • 从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码,开启你的AI原生开发之旅。


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 从 0 开始构建 Agent Harness Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com
这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats