对话 Uber 前 CTO:我如何用 5000 个微服务驯服这头失控的巨兽

本文永久链接 – https://tonybai.com/2026/05/10/scaling-uber-with-thuan-pham

大家好,我是Tony Bai。

在硅谷的黄金时代,曾有一家公司以一种近乎“暴力”的美学,重新定义了增长的速度。它的名字叫 Uber。

在最癫狂的岁月里,它以“周”为单位攻占新的城市,用海量的资本和补贴点燃市场,其业务增长曲线陡峭得如同悬崖峭壁。

但在这场增长的狂欢之下,是一套摇摇欲坠、濒临崩溃的技术系统。

2013 年,当 Tuan Pham(后来被称为 Uber 的“救火队长”)加入时,这家拥有 40 名工程师的公司,系统每周都会崩溃数次。而他面临的第一个挑战,就是公司的核心派单系统,只剩下 5 个月的寿命。

近日,这位传奇 CTO 接受了一次深度访谈。他不仅首次揭秘了当年与创始人 Travis Kalanick (以下称TK) 长达 30 小时的“魔鬼面试”,更详细复盘了 Uber 是如何在失控的边缘,被迫走上那条被全网群嘲、却又别无选择的 “5000 微服务” 之路。

今天,就让我们跟随 Tuan 的视角,重返那个硝烟弥漫的战场。

从船民到 MIT:一段关于生存的开端

Tuan Pham 的人生开局,堪称地狱模式。

他出生于越南,是战争的亲历者。1975 年后,由于家庭背景,他和家人被迫成为“越南船民”,挤在破旧的渔船上,冒着不足 50% 的生还率,在深夜逃离故土。

在海上漂泊了四天三夜,躲过风暴和海盗,他们最终在马来西亚登陆,却又被拖回大海,最终被印尼的一个荒岛收留。

一年后,他们以难民身份来到美国。身无分文,不懂英语,第一套衣服来自教堂的捐赠衣橱。

“生存”,是刻在他骨子里的第一性原理。

和很多技术天才一样,Tuan 在数学上展现了过人的天赋。高中时,他靠着一台有两个软盘的 IBM PC 自学了编程,甚至用脚本语言帮政府机构把需要 3 周才能完成的财务对账工作,压缩到了 3 小时。

凭借着优异的成绩和推荐信,他被 MIT 录取,正式开启了他的计算机科学之旅。

血泪的教训:两场失败,塑造了 Uber 的基因

在加入 Uber 之前,Tuan 的职业生涯并非一帆风顺。但正是这些宝贵的“失败”,让他积累了足以驾驭 Uber 这头巨兽的认知。

第一场失败,在 SGI(硅谷图形公司)

上世纪 90 年代,他参与了一个极其超前的项目——交互式电视。在那个连手机和互联网都还没普及的年代,他们已经实现了“视频点播、在线购物”。斯皮尔伯格、迈克尔·杰克逊都来参观过。但这个项目最终惨败,因为机顶盒的成本高达 4.5 万美元。这让他得到一条教训:光有伟大的技术没用,你必须在正确的时间、以正确的价格,出现在正确的市场。

第二场失败,在 NetGravity(一家互联网广告公司)

他们发明了动态广告系统,并成功上市。但另一家比他们晚成立的公司,靠着更轻量的“广告服务(Ad Service)”模式,野蛮生长,最终被 Google 收购。而他们,因为董事会要求“优先盈利”,错失了市场。这让他得到了另外一条教训:当市场窗口期出现时,增长速度压倒一切,哪怕是以亏损为代价。

这两条从真金白银和血泪中总结出的铁律,仿佛就是为日后的 Uber 量身定制的。

30小时的“魔鬼面试”:与 TK 的灵魂拷问

离开 VMware 后,Tuan 并未主动寻找工作。是 Benchmark 的传奇投资人 Bill Gurley(也是 Uber 的早期投资人)找到了他。Bill Gurley 认识 Tuan,源于十几年前那家失败的广告公司。

Tuan 在访谈中反复强调一个观点:

“我从不刻意经营人脉。你只需要把你手头的每一份工作做到极致,真诚地对待你身边的每一个人。随着时间推移,你的声誉会为你打开所有的大门。”

当他见到 Uber 的创始人 Travis Kalanick (TK) 时,一场长达 30 小时、横跨两周的马拉松式面试开始了。

TK 在白板上写下了密密麻麻的清单:从招聘开除、到代码质量、再到团队文化……他们每天 Skype 两小时,一个一个地辩论。

Tuan 回忆道,那根本不像面试,更像是两个合伙人在激烈地碰撞思想。有一次,聊到一半 TK 要赶飞机,他直接拿起电话让助理改签,然后继续辩论。

T.K. 对技术细节的痴迷,和近乎偏执的激情,让 Tuan 意识到,这是一个将技术视为公司命脉的创始人。

面试的最后,Tuan 发现,这 30 小时其实是一场“模拟工作”。TK 在用最高成本的方式,去观察当他们意见相左时,是否还能有效地沟通、并最终达成共识。

微服务之殇:我们根本不想搞 5000 个微服务!

Tuan 加入 Uber 时,公司只有 40 个工程师,但系统每周都会宕机数次。整个后端是一个巨大的单体应用,派单系统是用单线程的 Node.js 写的。为了扩容,工程师们只能不断地把程序挪到 CPU 更快的机器上(垂直扩容)。

Tuan 问团队:“如果最快的 CPU 也扛不住了怎么办?”

工程师说:“那就换一个有多颗 CPU 的机器。”

Tuan 再问:“那这些进程之间怎么共享状态?”

团队沉默了。

Tuan 迅速算出,当时最大的城市纽约,将在 5 个月后彻底冲垮派单系统的物理上限。

重写,是唯一的活路。

他只提了两个要求:1. 一个城市必须能被多台机器支撑;2. 一台机器必须能支撑多个城市。 没有新功能,只要活下去。

最终,团队在 8 月份惊险上线了新系统,暂时续上了命。

但真正的噩梦,来自那个名为 API 的巨型单体应用。随着业务的爆炸式增长(UberX 上线、新城市扩张),这个单体应用成了所有团队的瓶颈。任何一个新功能,都可能要排队等好几个团队的开发资源。

为了活下去,Tuan 和 TK 做出了那个后来被全行业“群嘲”的决定:

“任何新功能,一律不许再往单体里加!必须作为独立的服务(Microservice)去开发。”

同时,成立一个专门的团队,去把旧的单体应用一块块“拆骨”。

这个拆骨项目,代号“达尔文(Darwin)”。Tuan 苦笑道,如果时间静止,这个项目 3-6 个月就能搞定。但他们花了整整两年。

因为在他们拆解的同时,业务的增长速度比他们拆解的速度还要快!新功能被疯狂地加回到那个正在被拆的单体里。

“当你把一块代码剥离出去后,剩下的部分因为业务增长,变得比你剥离出去的还要大。我们就像在追着自己的尾巴跑。”

5000 个微服务,不是一个被精心设计出来的架构蓝图。它是在极端增长压力下,为了让几百个工程师能够并行开发、不互相阻塞,而被迫做出的“最不坏”的选择。

这是 Uber 用每年几亿美元的服务器成本,换来的开发速度。

中国速度:两个月,拿下中国市场

在 Uber 的历史上,最能体现这种“速度压倒一切”文化的,莫过于 2014 年底的“中国闪击战”。

圣诞节前,TK 宣布:新年过后,Uber 要全面进军中国。他给了 Tuan 两个月的时间,在中国本土,从零开始搭建一套完整的、物理隔离的数据中心。

Tuan 的工程团队评估后,给出的最快时间是 6 个月。他在湾区的朋友们听说后,都嘲笑他疯了:“没有 18 个月根本不可能。”

TK 不接受,最终两人“折中”到了 4 个月。

4 个月后,项目延期了。TK 很不爽。

5 个月后,项目再次延期。TK 暴怒。

Tuan 对 TK 承诺,再给一个月,但必须允许他们“分阶段上线”,而不是一次性点亮所有城市。

TK 同意了,但提了一个极其苛刻的条件:第一个上线的,必须是当时业务量最大的城市——成都。

Tuan 在访谈中回忆道,这在当时看来简直是自杀,但事后回想,这是 TK 做出的最天才的决定。

“当你把最硬的骨头啃下来之后,剩下的就全是下坡路了。整个团队的士气和信心都被拉满了。”

最终,他们真的做到了。IT 团队在两周内完成了服务器的跨国部署,软件团队在无数个通宵后,让代码在中美两地同时跑了起来。

没有人认为这能成功,但它就是成功了。 这就是 Uber 当时的魔力。

小结:AI 时代的生存法则

在访谈的最后,Tuan 聊到了如今最火热的 AI 编程。

他所在的新公司 FAIR,已经开始使用 Agent Swarm(智能体集群) 来辅助开发。他发现,顶级的工程师在使用 AI 后,产出能翻倍。

当被问及“AI 时代,如何区分优秀与平庸的工程师”时,Tuan 的回答,与他在 Uber 血战时总结出的经验如出一辙:

“好奇心、无畏、愿意尝试新事物、敢于打破常规。这些特质,在过去能让你脱颖而出,在今天,同样能让你成为驾驭 AI 的顶级玩家。平庸的人把 AI 当拐杖,而优秀的人把 AI 当作火箭推进器。”

从越南船民到硅谷之巅,Tuan Pham 的一生,就是一部关于“在混乱中寻找秩序,在极限压力下野蛮生长”的史诗。

Uber 的故事或许不可复制,但它留给我们的思考,远未结束。

在技术的世界里,从来没有完美的架构,只有与业务增长阶段相匹配的、充满妥协与权衡的草台班子。

而我们作为工程师的终极使命,就是在这个草台班子上,用最快的速度,把它搭成别人眼中坚不可摧的罗马。


今日互动探讨:

看完 Uber 的故事,你觉得在你的公司里,是应该优先选择“技术正确”的完美架构,还是“能快速上线”的野路子?你对微服务和单体架构有什么切身体会?

欢迎在评论区分享你的看法!


还在为写 Agent 框架频频死循环、上下文爆炸而束手无策?我的新专栏 从0 开始构建 Agent Harness 将>带你:

  • 抛弃臃肿框架,回归“驾驭工程 (Harness Engineering)”的第一性原理
  • 用 Go 语言手写 ReAct 循环、并发拦截与上下文压缩引擎等,复刻极简OpenClaw
  • 构建坚不可摧的 Safety Middleware 与飞书人工审批防线
  • 在底层实现 Token 成本审计、链路追踪与自动化跑分评估
  • 从“调包侠”进化为掌控大模型边界的“AI 操作系统架构师”

扫描下方二维码,开启从 0 开始构建Agent Harness 的实战之旅。


你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

Anthropic 工程师发文:别用 Markdown 了,HTML 才是 AI 的终极语言!

本文永久链接 – https://tonybai.com/2026/05/09/anthropic-engineer-say-html-is-the-ultimate-language-for-ai

大家好,我是Tony Bai。

在这个大模型(LLM)席卷一切的时代,如果说有什么东西是全体程序员的“共识”,那绝对是 Markdown

无论是写 Prompt,定义 Agent Skill,还是阅读大模型吐出的漫长代码审查报告,Markdown 凭借其极简的纯文本特性,几乎成了人类与 AI 沟通的“普通话(Lingua Franca)”

但就在近日,这个牢不可破的共识,被大模型领域的绝对王者——Anthropic(Claude 的母公司)自己人给掀翻了。

Claude Code 团队的核心工程师 Thariq,在 X (Twitter) 平台上抛出了一篇长文:使用 Claude Code:HTML 不讲理的有效性(The Unreasonable Effectiveness of HTML)

在这篇获得了上百万阅读量、上千次转发的神贴中,他毫不客气地宣称:

“我已经彻底停止使用 Markdown 了。对于智能体(Agent)时代来说,HTML 才是更完美的通信格式。”

这篇文章瞬间在技术圈引发了一场大地震。有人拍案叫绝,直呼“Game Changer(游戏规则改变者)”;也有人愤怒反驳,认为这简直是历史的倒车。

今天,我们也来解读一下这场顶级社区的论战,看看为什么连最懂大模型的人,都要抛弃我们最爱的 Markdown?而在 AI 时代,我们又该如何重新定义“代码的可读性”?

原罪暴露:当 Markdown 遇上“超级智能体”

一直以来,我们喜欢 Markdown,是因为它“简单”。

在那个我们只让 AI 帮我们写两个小函数、查一个 Bug 的“手工作坊”时代,Markdown 是完美的。

但现在的 Agent 变了。它们太强大了。

正如 Thariq 在文章中指出的:

“随着 Agent 变得越来越强大,我开始觉得 Markdown 变成了一种限制性格式。当我面对一个超过 100 行的 Markdown 文件时,阅读它变得极其困难。我想要更丰富的可视化、颜色、图表,我想要能够轻松地分享它们。”

这精准地戳中了当前所有高级 AI 开发者的痛点:信息密度的坍塌。

当你让 Agent 去审查一个包含 5 个文件、上百行改动的复杂 PR(Pull Request)时,如果用 Markdown 输出,你只会得到一面密密麻麻的“文本墙(Wall of text)”。

你无法高亮关键的代码行,无法并排对比修改前后的差异,更无法画出一个交互式的调用链路图。

在这个时候,Markdown 的“极简”,反而成了人类理解 AI 复杂输出的最大障碍。

降维打击:HTML 的“不讲理有效性”

面对信息密度的瓶颈,Thariq 给出了一剂猛药:彻底转向 HTML。

他惊奇地发现,现代的大模型(尤其是 Claude Sonnet 4.x 版本),在处理和生成 HTML 方面的能力,已经到了令人发指的地步。

他总结了 HTML 在 AI 交互中的四大降维打击能力:

1. 恐怖的“信息密度(Information Density)”

HTML 不仅能表达简单的标题和格式,它还能通过 \<svg> 直接内联生成精美的流程图,通过 CSS 生成带颜色的代码差异对比(Diff),甚至可以利用绝对定位(Canvas)来表达空间数据。

“可以说,Claude 几乎没有什么是不能用 HTML 高效表示的。”

2. 极佳的“视觉清晰度与可读性”

当 AI 帮你完成了一个宏大的架构设计,与其看几百行的纯文本,不如让 Claude 直接生成一个带有选项卡(Tabs)、插图、侧边栏导航的完整 HTML 网页。

Thariq 提到:“在实践中,我发现自己几乎不会去读超过 100 行的 Markdown,我也绝对无法让组织里的其他人去读它。但 HTML 文档就容易阅读得多。”

3. “双向交互(Two-way Interaction)”的魔法

这是最让人拍案叫绝的一点!

你可以让 Claude 生成一个带有滑块(Sliders)或按钮的 HTML 原型。你在浏览器里拖动滑块调整参数,觉得满意后,直接点击“复制为 JSON(Copy as JSON)”,然后再把这串参数喂回给 Claude Code 继续开发。

UI 变成了你和 AI 之间最直观的“调试器”。

4. 完美的分享体验

Markdown 极难分享,大多数人的浏览器直接打开是一片乱码。但 HTML,你只需要把它扔进 S3 或者发给同事,任何人在任何设备上双击就能看,甚至还能做响应式适配。

实战演练:从“提示词写手”到“数字导演”

这套理论绝不仅仅停留在纸面上。评论区里,无数被点醒的开发者开始疯狂晒出他们的实战案例。

  • 重塑 Code Review:不再看黑底白字的文本,直接让 Claude 生成一个带有内联边距注释、按严重程度着色的精美 HTML 审查报告。
  • A/B 测试方案对比:不知道产品该用哪种设计?让 AI 生成一个包含 6 种不同方案的网格布局 HTML 页面,把所有的优缺点并排陈列在眼前,一目了然。
  • 动态交互式报告:让 AI 去抓取 Git 提交历史、Slack 聊天记录,然后生成一份极度精美的周报网页,里面甚至包含了可交互的 SVG 图表。

正如一位开发者在评论中所说:

“所以你的意思是,我不应该要求一个 ASCII 字符画的草图,而是应该直接要求一个 HTML 的设计模型??我得去试试这个。用 Markdown 做计划,用 HTML 做设计。”

社区撕裂:一场关于“认知负荷”的哲学博弈

当然,如此颠覆性的观点,必然会引发强烈的抵触。

在推特的评论区,一场关于“效率 vs 消耗”的论战正在上演。

反对派(Markdown 死忠党)的核心论点极其犀利:Token 成本与编辑摩擦。

“HTML 在命令行里根本没法读,而且极其容易因为缺少闭合标签而崩溃。大多数 LLM 在长上下文中处理 HTML 会非常吃力。”

“HTML 确实在视觉上提供了更高的信息密度。但为了这点视觉信号,你要多花 2-4 倍的 Token 成本!这让我感觉非常糟糕。”

“Markdown 最大的优势是‘可编辑性’。如果我们不再亲手编辑文件,那么格式的选择就从‘什么最容易写’变成了‘什么最容易检查、微调并反馈给 Agent’。”

这是一场深刻的哲学博弈。

Markdown 代表的是“以人类编写为中心”的过去;而 HTML 代表的,则是“以 AI 生成、人类消费为中心”的未来。

当我们不再亲手敲击每一行代码,而是扮演“审查员”和“导演”的角色时,我们真的还需要在乎生成过程消耗了多少个

<

div> 标签吗?

小结:工具的终局,是顺应生产关系

Thariq 的这篇文章,之所以能引发如此巨大的反响,是因为它极其敏锐地捕捉到了 AI 时代生产关系的变化。

在过去,程序员是“工人”,我们需要 Markdown 这样轻巧的工具来减轻手腕的负担。
在未来,程序员是“厂长”,我们需要 HTML 这样丰富的看板,来快速审阅成千上万个 AI Agent 提交的工作报告。

“Markdown 适合思考(Planning),HTML 适合展示(Acting)。”

或许,正如评论区的一位老哥半开玩笑的预言:“XML 才是最后的赢家。立帖为证。”

在 AI 这个不知疲倦的“超级打字员”面前,所有曾经因为“太啰嗦”而被人类抛弃的富文本标记语言,都可能迎来一场轰轰烈烈的文艺复兴。

资料链接:https://x.com/trq212/status/2052809885763747935


今日互动探讨:

在日常使用大模型时,你更倾向于让它输出极简的 Markdown,还是信息量爆炸但耗费 Token 的 HTML?你觉得在 AI 时代,“代码的可读性”定义是否已经被彻底改写了?

欢迎在评论区分享你的实战心得!


还在为写 Agent 框架频频死循环、上下文爆炸而束手无策?我的新专栏 从0 开始构建 Agent Harness 将带你:

  • 抛弃臃肿框架,回归“驾驭工程 (Harness Engineering)”的第一性原理
  • 用 Go 语言手写 ReAct 循环、并发拦截与上下文压缩引擎等,复刻极简OpenClaw
  • 构建坚不可摧的 Safety Middleware 与飞书人工审批防线
  • 在底层实现 Token 成本审计、链路追踪与自动化跑分评估
  • 从“调包侠”进化为掌控大模型边界的“AI 操作系统架构师”

扫描下方二维码,开启从 0 开始构建Agent Harness 的实战之旅。


原「Gopher部落」已重装升级为「Go & AI 精进营」知识星球,快来加入星球,开启你的技术跃迁之旅吧!

我们致力于打造一个高品质的 Go 语言深度学习AI 应用探索 平台。在这里,你将获得:

  • 体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏,夯实你的 Go 内功。
  • 前沿 Go+AI 实战赋能: 紧跟时代步伐,学习「Go+AI应用实战」、「Agent开发实战课」、「Agentic软件工程课」、「Claude Code开发工作流实战课」、「OpenClaw实战分享」等,掌握 AI 时代新技能。
  • 星主 Tony Bai 亲自答疑: 遇到难题?星主第一时间为你深度解析,扫清学习障碍。
  • 高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术,碰撞思想火花。
  • 独家资源与内容首发: 技术文章、课程更新、精选资源,第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚,享受技术精进的快乐!欢迎你的加入!

img{512x368}


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 从 0 开始构建 Agent Harness Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com
这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats