DeepMind 亮出王炸:别再手写 Agent Harness 了,AI 已经学会自己写了!

本文永久链接 – https://tonybai.com/2026/06/17/deepmind-automation-agent-harness-ai-self-coding 大家好,我是Tony Bai。 过去的几个月,整个 AI 开发圈最火的词,无疑是 Agent Harness(智能体驾驭系统)。 从 Claude Code 到 OpenClaw,再到我自己的极客时间专栏,我们所有走在 AI 原生开发前沿的工程师,都在不遗余力地布道一个核心思想:大模型本身只是一个“毛坯大脑”,你必须为它手工打造一套精密的“外部骨骼(Harness)”,它才能真正干活。 ...

June 17, 2026 · 8 min · Tony Bai

告别 Flaky Tests:Go 官方拟引入 testing/nettest,重塑内存网络测试标准

本文永久链接 – https://tonybai.com/2026/02/10/goodbye-flaky-tests-go-testing-nettest-proposal 大家好,我是Tony Bai。 在 Go 语言的测试哲学中,我们一直追求快速、稳定和可重复。然而,一旦测试涉及到 net 包——无论是 HTTP 服务、RPC 框架还是自定义协议——这种追求往往就会撞上现实的墙壁。 ...

February 10, 2026 · 7 min · Tony Bai

Bug 激增 1.7 倍!AI 写代码:是速度的蜜糖,还是质量的砒霜?

本文永久链接 – https://tonybai.com/2025/12/28/state-of-ai-vs-human-code-generation-report 大家好,我是Tony Bai。 “天下武功,唯快不破。但在软件工程里,‘快’可能是致命的诱惑。” 2025 年,AI 编码助手/智能体已经成为开发者的标配。它像蜜糖一样,让我们尝到了开发效率飙升的甜头:从自然语言一键生成函数,到自动补全繁琐的样板代码,甚至的整个项目的源码,功能交付周期从未如此之短。 ...

December 28, 2025 · 6 min · Tony Bai

Go语言之父的反思:我们做对了什么,做错了什么

本文永久链接 – https://tonybai.com/2024/01/07/what-we-got-right-what-we-got-wrong 在《2023年Go语言盘点:稳中求新,稳中求变》和《Go测试的20个实用建议》两篇文章中,我都提到过已经退居二线的Go语言之父Rob Pike在Go开源14周年的那天亲自在GopherCon Australia 2023上发表了“What We Got Right, What We Got Wrong”的主题演讲来回顾Go诞生以来的得与失。近期Rob Pike终于将这次演进的文字稿发布了出来!GopherCon Australia也在油管上发布了这个演进的视频。Rob Pike的观点对所有Gopher都是极具参考价值的,因此在这篇博文中,我将Rob Pike的这次演讲稿翻译成中文,供大家参考(结合文字稿和视频),我们一起来领略和学习大师的观点。 ...

January 7, 2024 · 24 min · Tony Bai

使用go test框架驱动的自动化测试

本文永久链接 – https://tonybai.com/2023/03/30/automated-testing-driven-by-go-test 一. 背景 团队的测试人员稀缺,无奈只能“自己动手,丰衣足食”,针对我们开发的系统进行自动化测试,这样既节省的人力,又提高了效率,还增强了对系统质量保证的信心。 ...

March 30, 2023 · 10 min · Tony Bai

再谈组织工作效率提升

工作效率提升,是所有企业组织都追求的一个目标。高效率意味着用更少到人可以做更多的活儿,赚取更多的利润。员工收入也会有较大提升,有面子;管理层的收 入就更水长船高了。但说起来容易,做起来难。工作效率低下一直是让各个组织的管理者头疼的问题,组织无论大小,无论中外,皆如此。 ...

August 4, 2013 · 4 min · Tony Bai

做正确的事要趁早

最近闲暇时间在策划实施两件事儿:一是产品的自动化回归测试;二是尝试在项目中使用一些静态代码语义分析工具。我觉得这两件事是应该做的正确的事,对提升产品质量,提前发现产品中潜在的缺陷都大有裨益。但在做的过程中才感觉到:现在做有些晚,正确的事要趁早做。 去年自动化测试组发布了自动化测试框架的第一个版本,我们的产品参加了试点。但经过自动化测试组大半年的投入,效果十分有限,根本没有达到我的预期。最主 要的问题是使用他们提供的框架编写和维护test case都十分困难,工作量投入很大,这很打击大家的积极性。今年大家决定将自动化测试框架换成nokia开源的robotframework。经过预 研,robotframework完全可以满足我们的测试需求,并且robotframework的用例编写和维护效率太高了,编写门槛却很低。 ...

August 2, 2012 · 4 min · Tony Bai

领导意志

昨天是周五,按照工作计划,上午和组内同事做个人阶段性目标沟通。在与一位曾经在国外公司里做过项目的同事沟通时,他给我讲了这么一个故事:某一年的圣诞节前夕(圣诞节在西方人眼里是地位最高的节日了吧)他所在的那家公司的经理预感到圣诞节那天他们公司的网站的访问量激增的可能性会很大,为了保证网站在那圣诞节那天能"挺住",他要求手下的人对网站进行一次压力测试,并决定让手下用jmeter来做这件事情。手下人没有异议,由于没有用过jmeter,遂大家都忙碌起来,预研的、准备测试环境的等等。一切就绪后,正准备开始测试了,这时那位经理突然召集手下人说jmeter不能满足他们的压力测试要求,大家都惊愕之,并马上提出了反驳,因为jmeter工具是这位领导提出要使用的,现在又不用了,圣诞节已经迫在眉睫,更换压力测试工具肯定不能完成这个任务了。这位经理无奈妥协,结果是:通过jmeter压力测试后优化的网站顺利了通过了”圣诞节的考验“,不过大家都觉得这个过程很别扭。 ...

October 11, 2008 · 4 min · Tony Bai