标签 Go 下的文章

聊聊为什么我要花这么大精力,带大家手写 Agent Harness?

本文永久链接 – https://tonybai.com/2026/04/21/why-we-are-building-agent-harness-from-scratch

大家好,我是Tony Bai。

今天想和大家分享一个好消息:我筹备已久的极客时间专栏 从0 开始构建 Agent Harness 于昨日(2026.4.20)正式上架了。

在这个各种 AI 应用框架满天飞、“几行 Python 代码就能跑起一个智能体”的时代,很多朋友可能会问:“Tony,大家都在用现成且免费的轮子,你为什么还要花这么大的精力,甚至专门开一个 24 讲的专栏,带着大家用 Go 语言从零去手写一个底层的 Agent Harness 引擎?”

借着专栏上架的机会,我想和大家聊聊,我是如何看待当前 AI 应用开发的,以及为什么我坚定地认为,现在是时候撕开框架的黑盒,回归底层的 Harness(驾驭工程)了。

拐点已至:被框架掩盖的“失控”

如果你在一年多前开发过 AI Agent,你大概率深度使用过 LangChain、AutoGen 等框架。在那个大模型(如 GPT-3.5 时代)推理能力还比较薄弱的时期,我们需要框架来帮模型做意图路由、做任务拆解,框架扮演的是一个“事无巨细的微管家”。

但现在的技术发展,已经到了一个明确的“拐点”。

随着 Claude Sonnet 4.6/Opus 4.7、GPT-5.4、Gemini 3.1 Pro 等前沿模型的问世,模型原生已经具备了极其恐怖的逻辑规划和工具调用(Function Calling)能力。这时候,如果你尝试把基于传统框架拼接出来的 Agent 投入到真实的生产环境(比如让它去排查线上日志、或者做复杂的代码重构),问题往往接踵而至:

  • 上下文雪崩:Agent 读取了一个 3000 行的日志文件,框架没有任何底层的内存压缩机制,大模型 API 直接抛出 400 Token limit exceeded,任务当场中断。
  • 陷入死循环:Agent 遇到一个顽固的报错,连续 10 次执行了错误的 bash 命令,毫无察觉地在原地打转,直到把你的账户余额耗尽。
  • 失控的破坏力:你赋予了它执行本地 Shell 的权限,但在某次幻觉中,它试图执行不可逆的删除操作,而底层的框架根本没有提供可靠的挂起拦截机制。

这些令人“绝望”的瞬间让我意识到:单纯靠堆砌 Prompt 或者调用更高层级的应用框架,是永远无法构建出工业级 Agent 的。我们把最核心的控制权统统交给了不可见的黑盒。

什么是 Harness?为什么要独立研究它?

在剖析了近期震撼业界的顶级原生智能体(如 Claude Code、开源神作 OpenClaw、以及自带进化能力的 Hermes等)的工作机制后,我看到了一个不可逆转的趋势:

传统的框架层正在加速坍塌,作为独立工程研究的 Harness(驾驭工程)正在全面崛起。

什么是 Harness?简单来说,如果把大模型比作 CPU,把上下文(Context Window)比作极其昂贵的内存,那么 Harness 就是为这个 CPU 打造的微型操作系统(OS)。

Harness 不去干涉大模型的思考,它的核心职责极其底层且硬核:

  • 如何在濒临 OOM(内存溢出)的边缘,像垃圾回收器一样优雅地进行上下文阶梯压缩?
  • 如何在 Agent 陷入死循环时,像系统级中断一样注入强提醒,拉回它的注意力?
  • 如何在它试图执行高危命令前,挂起底层的协程,等待人类在飞书里的审批?
  • … …

我花这么大的精力带大家手写 Harness,就是因为现在的难点,早就不是“怎么让大模型输出 JSON”,而是“怎么在物理层面驾驭大模型的破坏力与失控”。

AI 应用的新阶段:Agent 正在成为一类完整的 Application

当我们拥有了一个健壮的 Harness 之后,我们对 AI 应用的认知也会随之重塑。

以前,AI 只是应用里的一个 Feature(功能),比如挂在网页右下角的一个聊天框。

但今天,当你把一个配置了特定 System Prompt 和专属 Skills(技能 SOP)的 Harness 引擎,丢进某一个特定的业务目录里运行时,这个 Agent 本身,就成了一个完整的 Application。

当然,AI 应用的形态是多元的,Agent 并非唯一的范式——AI 作为功能模块嵌入传统产品的场景依然大量存在。

但对于那些以自主完成复杂任务为核心价值的应用而言,”AI App = AI Agent”这个等式正在越来越多的场景下成立。我们不再是写满是 CRUD 的业务代码,我们是在为不同形态的智能体(如:编码Agent、自动化运维 Agent、自动化 CR 助手等)编写底层”物理定律”。

极简哲学:为什么手写能带来认知跃迁?

相较于一两年前的开发模式,今天顶尖的 Agent 项目展现出了一种令人拍案叫绝的“返璞归真”。

以 OpenClaw 为代表的新一代驾驭工程,抛弃了复杂:

  • 最简工具法则:不再堆砌几十个专用 API 导致上下文膨胀,只给模型暴露 Read、Write、Edit 和 Bash 等基础原语工具。让大模型用自然语言去驱动底层的操作系统。
  • 状态外部化:彻底抛弃内存里人类不可读的复杂状态机。强制大模型把宏观计划写在 PLAN.md 里,把微观进度写在 TODO.md 里。把每天的记忆变成了普通的文本文件,不仅实现了零成本的断电续传,更让人类可以随时在 IDE 里修改文件,实现最优雅的人机协同(Human-in-the-loop)。
  • … …

如果你不亲自手写一遍这个引擎,你永远只能在外围惊叹这些设计,而无法将其转化为自己解决复杂业务问题的武器。

专栏的策划:从骨架到全息监控

为了把这些前沿的理念落地,我没有选择纸上谈兵。我决定带着大家用 Go 语言(云原生时代构建基础设施的最佳语言),手敲一个名为 go-tiny-claw 的工业级引擎。

我们的旅程不走捷径,专栏规划了极具层次感的 24 讲大纲:

细心的朋友会发现,除了核心引擎和工具链,我在专栏的后期(模块五),花了不小的篇幅去写 成本追踪(Cost Tracker)链路回放(Tracing)自动化跑分(Benchmark)

之所以加入这些章节,是出于对 AI Agent 工程化落地 的深切体悟。

在企业里,如果一个智能体没有“仪表盘”,你连它跑一次花了多少美金都不知道;如果没有 Tracing 的 JSON 树,当任务在半夜崩溃时,你面对满屏黑盒日志根本无从 Debug;如果没有自动化的 Benchmark,你改了一行提示词,都不知道系统是变聪明了还是变笨了。

把玄学变成工程学,这是从“玩具”走向“工业级”的必经之路。

抛砖引玉:拥抱前沿,共同进化

坦白地说,Harness Engineering(驾驭工程)是一个极其前沿、且目前在业界依然处于野蛮生长和快速迭代的阶段。

无论是开源的 OpenClaw 和 Hermes ,还是Claude Code 的非官方流出,又或是学术界的最新研究论文,都在不断刷新着我们对 Harness 架构的认知上限。

这个专栏定位是 Agent Harness 的概念入门与环环相扣的底层实战。专栏里的每一讲(比如基于双重降级的上下文掩码压缩、或者是错误自愈模板的注入),其实都值得单独抽出来,作为更深入的课题去研究。

我就算是为大家“抛砖引玉”了。

以专栏中提到的 “Session Context 阶梯压缩” 为例。在专栏里,为了保持架构的极简易懂,我们采用了高效的字符级“远期全量掩码”与“近期掐头去尾截断”策略。

但这远非终点。

大家在学习后,完全可以去查阅 Claude Code 源码中更多层级的上下文折叠思路,或者探索多智能体(Multi-Agent)在 Harness 层的更优调度解法。

如果在未来业界出现了颠覆性的架构理论,我也会以“加餐”的形式在专栏中及时跟进。

邀请你加入这场“造轮子”的旅程

未来已来,它就藏在那些最底层的代码和极简的架构哲学中。

只有亲自造过轮子的人,才知道车辆在高速过弯时,底盘的极限到底在哪里。如果你也不满足于做大模型时代的“调包侠”,如果你也渴望掌控代码的绝对执行权,欢迎加入我的新专栏。

点击这里或扫描下方二维码,亲自打造属于你的工业级智能体引擎。

感谢大家一直以来的支持。我们,专栏里见!


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

从“开源英雄”到“社区公敌”,Ollama 到底做错了什么?

本文永久链接 – https://tonybai.com/2026/04/18/ollama-from-open-source-hero-to-community-enemy

大家好,我是Tony Bai。

两年前,在本地大模型的蛮荒时代,Ollama 曾如一道神光,照亮了无数普通开发者的探索之路。

凭借那句魔咒般的 ollama run llama3,它以一种近乎“降维打击”的优雅,将普通人与本地 AI 之间的天堑夷为平地。

一时间,Ollama 被盛赞为“本地 AI 的 Docker”、“开源精神的典范”,几乎成了无数技术布道者口中的“开源英雄”。

但就在几天前,一篇名为《本地大模型生态系统不再需要 Ollama》的文章,在技术社区 Hacker News 上,引发了一场“社区公审”

文章详细罗列了 Ollama 在享受了社区的赞誉之后,犯下的种种“罪行”:从对核心依赖 llama.cpp 长达 400 多天的“选择性遗忘”,到试图用私有模型格式“绑架”用户,再到其背后若隐若现的“VC 商业化”套路……

一夜之间,Ollama 的形象从“屠龙少年”,变成了那条它曾经挑战的“恶龙”。

今天,我们就来深度复盘这场顶级社区的大讨论,看看这位曾经的“开源英雄”,究竟是如何一步步走向“社区公敌”的深渊的。

第一宗罪:对生身之父的“背叛”与“除名”

Ollama 之所以能如此快速地在各种平台上运行大模型,其背后最大的功臣,是一个名为 llama.cpp 的 C++ 开源库。llama.cpp 是真正负责模型推理的底层引擎。

Ollama 的 v0.0.1 版本,在其 README 中曾明确写道:“一个用 Go 编写的快速推理服务器,由 llama.cpp 驱动。”

Ollama 的本质,是一个基于 llama.cpp 构建的、优化了用户体验的“包装器(Wrapper)”。

然而,随着 Ollama 的声名鹊起,llama.cpp 的名字,却在其官网和宣传中,被刻意地、系统性地抹去了。

在 Hacker News 的帖子中,有用户愤怒地指出:

“这根本不是开源礼仪的问题。MIT 协议只有一个核心要求:包含版权声明。Ollama 没有做到。”

“社区注意到了。GitHub Issue #3185 在 2024 年初就被提出,要求 Ollama 遵守协议。这个 Issue 在 400 多天里,没有得到任何维护者的回应。

直到社区忍无可忍,发起了 PR,Ollama 的联合创始人才最终在 README 的最底部,加上了一行极其微小的致谢:“llama.cpp 项目由 Georgi Gerganov 创建。”

这种对核心上游项目近乎“羞辱性”的冷处理,被社区视为一种赤裸裸的“背叛”,激怒了所有信奉开源精神的开发者。

第二宗罪:用“私有格式”构建“数据监狱”

比忘记致谢更让开发者无法容忍的,是 Ollama 为了“锁定用户”,而精心设计的私有化模型存储格式

如果你用过 Ollama,你一定经历过这样的困惑:

你用 ollama pull 下来的模型文件,被存储在你的 Home 目录下,文件名是一串毫无意义的哈希值。你根本无法将这个 GGUF 文件,直接分享给其他工具(比如 LM Studio 或 Jan)使用。

Hacker News 的一位用户一针见血地指出了这个设计的“阴险”之处:

“我停止使用 Ollama 的原因就在于此。我能理解他们可能是为了做去重(Deduplication),但这使得我无法与其他工具共享同一个模型。每个工具都只能指向它自己的文件。无论他们的意图如何,这都在客观上,让你极难尝试其他工具。”

更糟糕的是,Ollama 会在下载模型时,对原始的 GGUF 文件进行一些“魔改”,并使用自己的一套私有配置。这导致了另一个灾难:性能下降

有人在评论中分享道:“我最近开始使用 Jan,然后用 llama.cpp 和本地的 Ollama 跑同一个模型,llama.cpp 的速度明显更快。”

用更差的性能、更封闭的格式,换取所谓“简单”的用户体验。这背后,是典型的“建立围墙花园”的商业化思维。

第三宗罪:“VC 死亡陷阱”的经典复刻

Ollama 为什么要这么做?

一位用户在评论中扒出了 Ollama 创始团队的“前科”,让所有人恍然大悟。

“Ollama 是一家由 Y Combinator 支持的创业公司,其创始人之前构建了一个被 Docker 收购的 Docker GUI 工具。这个剧本太熟悉了:
1. 包装一个现有的开源项目,做一个用户友好的界面。
2. 建立用户基础,获得社区信任。
3. 融资,然后想办法商业化。
4. 最小化对上游的致谢,让产品看起来是自给自足的。
5. 创造锁定,用私有格式和哈希文件名,让用户无法迁移。
6. 推出闭源组件(GUI App)和云服务,开始收割。”

这套从 Docker 时代的 Kitematic 延续而来的“VC 死亡陷阱”,正在本地大模型领域被完美复刻。

社区的反击:大逃杀与“去 Ollama 化”

在这场社区的“公审”中,愤怒之余,开发者们也给出了大量极具建设性的“替代方案”。一场“去 Ollama 化”的大逃杀正在上演。

方案一:回归 llama.cpp 本身,王者归来

很多用户惊讶地发现,在他们唾弃 Ollama 的这段时间里,llama.cpp 自身已经进化成了一个极其强大的“完全体”。

它现在不仅自带了现代化的 Web UI(通过 llama-server),支持 OpenAI 兼容的 API,甚至还推出了“路由模式”,可以实现模型的“热插拔(Hot-swapping)”。

方案二:拥抱真正开放的“包装器”

社区推荐了大量同样易用,但秉持着真正开源精神的替代品,比如:

  • LM Studio:自带强大的 GUI,底层使用 llama.cpp,暴露所有可调参数,支持任何 GGUF 模型,不搞“锁定”。
  • Jan (jan.ai):另一个开源的桌面应用,界面清爽,设计本地优先。
  • llamafile:由 Mozilla 支持,可以将模型和 llama.cpp 本身打包成一个“单一可执行文件”,真正实现“一键启动”,且完全开放。

小结:当便利性遭遇开源精神

Ollama 的故事,是近年来开源商业化领域最值得深思的一个案例。

毫无疑问,Ollama 解决了本地大模型领域一个极其真实的痛点:极致的易用性(Ease of use)。它就像当年的 Docker,让无数普通人跨越了复杂的门槛。

但在追求极致 UX 的同时,它却似乎忘记了自己赖以生存的根基——那个由 Georgi Gerganov 等无数开源贡献者用爱发电构建起来的 llama.cpp 生态。

Hacker News 上的这场论战,并没有全盘否定 Ollama 的价值。但它向所有试图通过“包装开源”来构建商业帝国的创业者,提出了一个极其严肃的警告:

用户体验的简化,永远不能以牺牲“开放性”和对上游社区的“尊重”为代价。

你可以站在巨人的肩膀上,但你不能在站上去之后,假装那个巨人不存在。

作为开发者,我们享受着开源带来的巨大红利。但在选择工具时,除了便利性,我们或许也应该多一份清醒:去看看它的背后,是否隐藏着一个正在试图关上的“围墙花园”。

资料链接:

  • https://news.ycombinator.com/item?id=47788385
  • https://sleepingrobots.com/dreams/stop-using-ollama/

今日互动探讨:

你在使用 Ollama 时,是否也曾被它私有的模型管理方式所困扰?对于“包装开源”并进行商业化的模式,你是支持还是反对?

欢迎在评论区分享你的看法!


还在为“复制粘贴喂AI”而烦恼?我的新专栏 AI原生开发工作流实战 将带你:

  • 告别低效,重塑开发范式
  • 驾驭AI Agent(Claude Code),实现工作流自动化
  • 从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码,开启你的AI原生开发之旅。


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 从 0 开始构建 Agent Harness Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com
这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats