标签 运行时 下的文章

Rob Pike的“抱怨”与Go的“解药”:直面软件膨胀的四大根源

本文永久链接 – https://tonybai.com/2025/04/27/rob-pike-on-bloat

大家好,我是Tony Bai。

今年年初,Go语言之父、UTF-8编码的发明者Rob Pike的一篇题为”On Bloat”(关于膨胀)的演讲幻灯片(在2024年下旬做的)在技术圈,尤其是在Hacker News(以下简称HN)上,引发了相当热烈的讨论。Pike作为业界泰斗,其对当前软件开发中普遍存在的“膨胀”现象的犀利批评,以及对依赖管理、软件分层等问题的深刻担忧,无疑戳中了许多开发者的痛点。

HN上的讨论更是五花八门,开发者们纷纷从自身经历出发,探讨“膨胀”的定义、成因和后果。有人认为膨胀是“层层叠加的间接性”导致简单修改寸步难行;有人认为是“不必要的功能堆砌”;还有人归咎于“失控的依赖树”和“缺乏纪律的开发文化”。

那么,Rob Pike究竟在“抱怨”什么?他指出的软件膨胀根源有哪些?而作为我们Gopher,Go语言的设计哲学和工具链,能否为我们从纯技术层面提供对抗膨胀的“解药”呢?今天,我们就结合Pike的演讲精髓和HN的热议,深入聊聊软件膨胀的四大根源,并从Go的视角尝试寻找一下应对之道。

“膨胀”的真相:远不止代码大小和运行速度

在深入探讨根源之前,我们需要认识到,“膨胀”并不止是字面意义上我们理解的最终编译产物的大小或者应用的运行速度慢,Pike的观点和HN讨论中的“软件膨胀”体现在多个维度:

  • 复杂性失控: 过度的抽象层次、复杂的依赖关系、难以理解的代码路径,使得维护和迭代变得异常困难。
  • 维护成本剧增: 添加新功能的长期维护成本(包括理解、测试、修复Bug、处理兼容性)远超初次实现的成本,但往往被低估。
  • 不可预测性与脆弱性: 庞大且快速变化的依赖树使得我们几乎无法完全理解和掌控软件的实际构成和行为,任何更新都可能引入未知风险。

下面我们具体看看Pike指出的“膨胀”几个核心根源:

根源一:特性 (Features) —— “有用”不等于“值得”

Pike 指出,我们不断地为产品添加特性,以使其“更好”。但所有特性都会增加复杂性和成本,而维护成本是最大的那部分,远超初次实现。他警示我们要注意“有用谬论” —— 并非所有“有用”的功能都值得我们付出长期的维护代价。

HN讨论也印证了这一点:功能冗余、为了匹配竞品或满足某个高层“拍脑袋”的想法而添加功能、甚至开发者为了个人晋升而开发复杂功能的现象屡见不鲜。

技术层面:Go的“解药”在哪?

  • 简洁哲学: Go从设计之初就强调“少即是多”,鼓励用简单的原语组合解决问题,天然地抵制不必要的复杂性。
  • 强大的标准库: Go 提供了功能丰富且高质量的标准库,覆盖了网络、并发、加解密、I/O 等众多领域,减少了对外部特性库的依赖。很多时候,“自己动手,丰衣足食”(使用标准库)比引入一个庞大的外部框架更符合Go的风格。
  • 关注工程效率: Go的设计目标之一是提高软件开发(尤其是大型项目)的工程效率和可维护性,这促使Go社区更关注代码的清晰度和长期成本。

注:技术层面包括语言、工具以及设计思路和方法。

根源二:分层 (Layering) —— 在错误的层级“打补丁”

Pike 认为,现代软件层层叠加(硬件 -> 内核 -> 运行时 -> 框架 -> 应用代码),当出现问题时,我们太容易在更高的层级通过包装(wrap)来“修复”问题,而不是深入底层真正解决它。这导致了层层叠叠的“创可贴”,增加了复杂性和维护难度。他列举了ChromeOS文件App的例子,并强调要在正确的层级实现功能和修复

在HN的讨论中,有开发者描述的修改按钮颜色需要穿透17个文件和多个抽象层的例子,正是这种“错误分层”或“过度抽象”的生动体现。

技术层面:Go的“解药”在哪?

  • 小接口哲学: Go 鼓励定义小而专注的接口,这使得组件之间的依赖更清晰、更松耦合。当问题出现时,更容易定位到具体的接口实现层去修复,而不是在外部层层包装。
  • 组合优于继承: Go 通过组合(struct embedding)而非继承来实现代码复用,避免了深度继承带来的复杂性和脆弱性,使得在“正确层级”修改代码更易操作。
  • 显式错误处理: if err != nil 的模式强制开发者在调用点处理错误,使得问题更难被“隐藏”到上层去统一“包装”处理,鼓励在错误发生的源头附近解决或添加上下文。

根源三:依赖 (Dependencies) —— 看不见的“冰山”

这是Pike演讲中着墨最多、也最为忧虑的一点。他用数据(NPM 包平均依赖 115 个其他包,每天 1/4 的依赖解析发生变化)和实例(Kubernetes 的复杂依赖图)强调:

  • 现代软件依赖数量惊人且变化极快。
  • 我们几乎不可能完全理解自己项目的所有直接和间接依赖。
  • 依赖中隐藏着巨大的维护成本、Bug 和安全风险
  • 简单的 npm update 或 audit 无法解决根本问题

他强烈建议要理解依赖的成本严格、定期地审视依赖树,并推荐了 deps.dev 这样的工具。

HN 社区对此深有同感,纷纷吐槽“为了一个函数引入整个库”、“脆弱的传递性依赖”、“供应链安全”等问题,并呼唤更好的依赖分析工具。

技术层面:Go的“解药”在哪?

  • Go Modules: 相比 NPM 等包管理器,Go Modules 提供了相对更好的依赖管理机制,包括语义化版本控制、go.sum 校验和、最小版本选择 (MVS) 等,提高了依赖的可预测性和安全性,但也要注意Go module并非完美
  • 强大的标准库: 这是 Go 对抗依赖泛滥的最有力武器。很多功能可以直接使用标准库,避免引入外部依赖。
  • 社区文化: Go 社区相对而言更推崇稳定性和较少的依赖。引入一个大型框架或过多的外部库在 Go 社区通常需要更充分的理由。
  • 工具支持: Go 提供了 go mod graph, go mod why 等命令,可以帮助开发者理解依赖关系。结合 deps.dev,可以在一定程度上实践 Pike 的建议。

根源四:开源模式 (Open Source Development) —— “大门敞开” vs “严格把关”

Pike 对比了两种开源开发模式:

  • “真正的开源方式” (The true open source way): 接受一切贡献 (Accept everything that comes)。他认为这是膨胀和 Bug 的巨大来源
  • 更好的方式: 设立严格的代码质量、标准、评审、测试、贡献者审查等“门槛”,对允许合入的内容有标准。这种方式维护成本低得多。

他暗示 Go 项目本身更倾向于后者,强调“先做好再提交”(make it good before checking it in)。可能很多Gopher也感受到了这一点,Go项目本身对代码质量的review非常严格,这一定程度上也“延缓”了一些新特性进入Go的时间点。

HN 的讨论中也涉及了类似 “Bazaar vs Cathedral” 的模式对比,但观点更加复杂,认为现实中的项目往往处于两者之间的某个位置,并且“完全不接受外部贡献”也并非良策。

技术层面:Go的“解药”在哪?

  • Go 自身的开发模式: Go 语言本身(由 Google 主导)的开发流程相对严谨,对代码质量和向后兼容性有较高要求,可以看作是“严格把关”模式的体现。
  • 标准库的设计: Go 标准库的设计精良、接口稳定,为开发者提供了一个高质量的基础平台,减少了对外部“随意贡献”的依赖。
  • 社区项目实践: 观察 Go 社区一些知名的开源项目,其贡献流程和代码标准通常也比较严格。

反思与现实:Go 也非万能,“警惕与纪律”仍是关键

虽然 Go 的设计哲学和工具链在对抗软件膨胀方面提供了许多“天然优势”和“解药”,但我们必须清醒地认识到,Go 语言本身并不能完全免疫膨胀

正如 Pike 在其“建议”(Advice) 中反复强调的,以及 HN 讨论中部分开发者指出的,最终软件的质量很大程度上取决于开发者和团队的“警惕与纪律” (vigilance and discipline)

  • 我们是否真正理解并避免了增加不相称成本的特性
  • 我们是否努力在正确的层级解决问题
  • 我们是否审慎地评估和管理了每一个依赖
  • 我们是否坚持了高标准的开发和评审流程

如果缺乏这些,即使使用 Go,项目同样可能变得臃肿、复杂和难以维护。同时,HN 讨论也提醒我们,软件膨胀背后还有更深层次的组织、文化和经济因素,这些往往超出了单纯的技术和开发者纪律所能解决的范畴。

小结:拥抱 Go 的简洁,但需务实前行

Rob Pike 的“抱怨”为我们敲响了警钟,Hacker News 的热议则展现了软件膨胀问题的复杂性和普遍性。它确实是我们在工程实践中需要持续对抗的“熵增”现象。

Go 语言以其简洁、显式、组合的设计哲学,以及强大的标准库和相对稳健的依赖管理,在技术层面上,为我们提供了对抗膨胀的有力武器。理解并拥抱这些 Go 的“基因”,无疑能在一定程度上帮助我们构建更健康、更可持续的软件系统。

当然,Pike 的观点也并非金科玉律。有批评者指出,他的视角可能带有一定的“NIH(非我发明)倾向”,并且存在两个关键的“盲点”:

  1. 忽视了“不使用依赖”同样是巨大的技术债。 每一行自写的代码都需要永远维护。
  2. 现实中的选择往往不是“使用依赖 vs 自己实现”,而是“使用依赖 vs 根本不做这个功能”。 面对复杂的合规要求(如 ADA、GDPR)、第三方集成或 FIPS 认证等,从零开始构建的成本(可能需要数百人年)往往让“自己实现”变得不切实际。为了让产品能够及时上线并满足用户(哪怕是 Pike 本人可能也在使用的“缓慢”网站)的需求,引入依赖和一定的“膨胀”有时是必要且务实的选择。

注:“NIH(非我发明)倾向”是一种心理现象,指的是人们对他人提出的想法或创新持有偏见,通常因为这些想法不是自己发明的。这种倾向使得人们倾向于低估或拒绝其他人的创意,尽管这些创意可能是有价值的。

这种批评也提醒了我们,虽然 Pike 对简洁和纪律的呼吁值得我们高度重视,但在真实的商业环境和复杂的工程约束下,我们必须做出务实的权衡。纯粹的技术理想有时需要向现实妥协。

最终,我们每一位 Gopher 都需要在理解 Go 简洁之道的同时,保持批判性思维和务实态度。 在日常的每一个决策中,审慎地权衡简单与复杂、理想与现实、引入依赖与自主掌控,才能在这场与“膨胀”的持久战中,找到最适合我们项目和团队的平衡点,交付真正有价值且可持续的软件。

你如何看待 Rob Pike 对软件膨胀的观点?你认为他的批评切中要害,还是忽视了现实的复杂性?欢迎在评论区分享你的思考与实践!

参考资料

  • Rob Pike – On Bloat – https://docs.google.com/presentation/d/e/2PACX-1vSmIbSwh1_DXKEMU5YKgYpt5_b4yfOfpfEOKS5_cvtLdiHsX6zt-gNeisamRuCtDtCb2SbTafTI8V47/pub?slide=id.p
  • HN:On Bloat – https://news.ycombinator.com/item?id=43045713
  • Pike is wrong on bloat
  • On Bloat – https://commandcenter.blogspot.com/2025/02/on-bloat-these-are-slides-from-talk-i.html

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

Go开发者必看!Uber如何利用PGO将Go服务性能优化推向新高度?

本文永久链接 – https://tonybai.com/2025/04/11/uber-go-pgo-optimization

对于像Uber这样广泛采用Go语言(Uber 60%的CPU资源都用于支撑Go服务运行)的科技巨头而言,性能优化不仅关乎用户体验,更直接影响着运营成本。继多年前通过GOGC调优节省7万CPU核心后,Uber近期再次发力,分享了其在大规模Go服务中部署Profile-Guided Optimization (PGO) 的实践经验,并通过自动化框架和工具创新,克服了关键挑战,实现了显著的性能收益。在这篇文章中,我就来介绍一下Uber的PGO优化之旅,供大家参考。

1. PGO:Go近几个版本持续投入的性能优化手段

Profile-Guided Optimization (PGO),即配置文件引导的优化,是一种利用程序实际运行时的性能分析数据(Profile)来指导编译器进行优化的技术。相比传统的静态分析和启发式规则,PGO能够让编译器更精准地识别热点代码路径、函数调用频率、分支预测等,从而做出更优的优化决策,例如:

  • 更智能的函数内联(Inlining): 基于实际调用频率,更精确地决定内联哪些“热”函数,即便这些函数在常规编译时可能不会被内联,从而减少函数调用开销。
  • 接口调用的去虚拟化(Devirtualization): 在PGO数据表明接口变量在运行时通常指向特定具体类型时,可以将动态派发转换为更高效的直接调用。
  • 优化的代码布局: 通过基本块重排、函数分割、函数重排等,改善指令缓存(iCache)和TLB的命中率,减少CPU前端停顿。

Go语言自Go 1.20版本开始引入对PGO的支持(最初侧重于内联优化),并在Go 1.21中,PGO实现生产可用,并增加了PGO驱动的去虚拟化(Devirtualization)。这表明Go官方对利用运行时信息提升性能的重视以及持续的投入。并且,通过用户的实际体验报告来看,PGO的确可以在一定程度上改善Go应用的性能,在Go 1.21及后续版本中,启用PGO 后,工作负载的性能常会有2%到7%的提升。

不过此前一直缺少来自大厂对PGO实践效果的声音,而Uber恰恰满足了Go社区的这个需求。

2. Uber的大规模PGO实践:自动化与挑战

面对数千个Go微服务,Uber在内部构建了一个持续优化的PGO框架

其流程大致如下:

  • 持续性能分析: 每日自动收集生产环境中多个服务实例的pprof CPU profiles。
  • 配置文件聚合: 将收集到的profiles进行合并,生成具有代表性的服务性能画像。
  • 服务注册: 通过配置系统,选择性地为特定服务开启PGO编译。
  • CI/CD 集成: 在持续集成环节,使用-pgo标志和生成的profile文件编译Go服务。
  • 部署与监控: 将PGO优化的二进制文件部署到生产环境,并通过监控仪表盘追踪性能变化。

然而,大规模推广PGO并非一帆风顺。Uber很快遇到了一个关键挑战:启用PGO后,部分服务的编译时间急剧增加,最高可达8倍!这严重影响了开发和部署效率。

通过深入分析,团队发现根源在于Go编译器在为每个包编译时,都需要重复读取和解析完整的pprof文件,这在高并发的构建系统中造成了巨大的I/O和CPU开销,占据了PGO编译流程中高达95%的时间。

如何解决这个问题呢?我们接着看Uber工程师的创新方案。

3. 破局:创新的Profile预处理工具

为了解决编译耗时的瓶颈,Uber与Google Go编译器团队合作,开发并向上游贡献了一个profile预处理工具(该功能已集成到Go 1.23)。

这个工具的核心思想是“一次解析,多次使用”。它能够独立运行,提前读取原始的pprof文件,并解析profile数据以提取函数调用关系和频率信息。关键信息被转换并缓存为一种紧凑的中间格式(WeightedCallGraph,或加权调用图),使得Go编译器可以直接读取这种轻量级的中间格式,无需再解析庞大的pprof文件,从而显著降低编译开销。

在Uber内部部署该预处理工具并每日更新预处理后的profile后,有效解决了PGO带来的编译时间增加问题,大部分服务的编译耗时恢复到了接近优化前的水平,为PGO的大规模应用铺平了道路。

既然问题解决了,那PGO优化带来的最终效果如何呢?下面就来揭晓答案。

4. PGO的性能影响:实证与观察

虽然在Uber复杂的生产环境中精确衡量PGO的独立影响(排除流量波动、自动伸缩、代码变更等因素)存在挑战,但他们的分析依然揭示了PGO的价值。他们分别观察了基准测试的结果以及生产环境的结果。

  • 合成基准测试

在流行的go-json库基准测试中,PGO带来了平均12% 的性能提升,部分微基准测试提升超过20%。观察发现,PGO显著降低了30%以上的iTLB misses,并能内联一些因体积过大而被默认启发式规则忽略的热点函数(如checkValid)。在tally指标库基准测试中,PGO也带来了平均10% 的性能提升,部分测试超过50%。

  • 生产环境观察

通过对比启用PGO前后7天的性能数据,Uber对其Top 6的Go服务进行了分析。结果显示,启用PGO后,这些服务的CPU核心分配数出现了可见的下降趋势。综合估算,PGO优化(主要是内联改进)在这些顶级服务中贡献了约4% 的性能增益,相当于节省了约24,000个CPU核心

此外,通过对比 PGO 前后的profile火焰图,可以确认PGO确实内联了之前未被内联的关键热点函数,验证了性能提升主要来源于PGO优化。

5. GOGC调优回顾:Uber的优化基因

值得一提的是,PGO并非Uber在Go性能优化上的首次大规模尝试。

多年前,他们通过名为GOGCTuner的内部工具,解决了Go GC(垃圾回收)在大量服务中CPU占用过高的问题。默认的GOGC=100策略对于内存使用模式多样且运行在有内存限制容器中的服务并非最优,容易导致GC过于频繁或存在OOM风险。

为此,Uber开发了GOGCTuner库,能够根据容器的cgroup内存限制动态调整GOGC值,例如设定一个内存使用上限百分比(如70%),以在保证内存安全的前提下尽可能减少GC次数,从而降低CPU开销。该工具巧妙地利用runtime.SetFinalizer实现了低开销的GC事件触发调整机制,最终为Uber节省了约70000个CPU核心。具体内容可以参见本文参考资料中的”How We Saved 70K Cores Across 30 Mission-Critical Services”一文。

从GOGC调优到PGO自动化,也体现了Uber在Go性能优化领域持续投入和系统化解决问题的工程文化。

6. 小结

Uber的实践清晰地表明,PGO是Go性能优化的一个强大武器,尤其对于CPU密集型或具有复杂调用关系的应用。虽然大规模应用PGO会遇到挑战(如编译时间),但通过工具创新(如Go 1.23集成的profile预处理功能)是完全可以克服的。

对于广大Go开发者而言,关注PGO显得尤为重要。随着Go版本的迭代,PGO的能力和易用性也在不断提升,了解并尝试在自己的项目中应用PGO,可能会带来意想不到的性能收益。

Go 1.23及以后版本集成的PGO预处理能力,大大降低了PGO的使用门槛,有效解决了编译耗时的主要痛点。同时,学习Uber系统化、数据驱动的性能优化方法论,从GC调优到PGO,能够帮助开发者持续挖掘性能潜力。

Go社区与像Uber这样的大规模实践者之间的良性互动(问题发现、解决方案到上游贡献)正在不断推动Go语言及其工具链走向成熟和高效。我们期待看到更多Go应用通过PGO等先进优化技术实现性能的新突破。

本文内容主要基于Uber Engineering Blog的两篇文章(见参考资料列表),特别感谢Uber工程师团队(包括前成员Jin Lin、Raj Barik等)以及Google Go编译器团队(Michael Pratt、Cherry Mui、Austin Clements等)在PGO领域的探索、实践和分享。

你对在项目中使用PGO有什么看法或疑问吗?欢迎留言讨论!

7. 参考资料


Gopher部落知识星球在2025年将继续致力于打造一个高品质的Go语言学习和交流平台。我们将继续提供优质的Go技术文章首发和阅读体验。并且,2025年将在星球首发“Gopher的AI原生应用开发第一课”、“Go陷阱与缺陷”和“Go原理课”专栏!此外,我们还会加强星友之间的交流和互动。欢迎大家踊跃提问,分享心得,讨论技术。我会在第一时间进行解答和交流。我衷心希望Gopher部落可以成为大家学习、进步、交流的港湾。让我相聚在Gopher部落,享受coding的快乐! 欢迎大家踊跃加入!

img{512x368}
img{512x368}

img{512x368}
img{512x368}

著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格6$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

Gopher Daily(Gopher每日新闻) – https://gopherdaily.tonybai.com

我的联系方式:

  • 微博(暂不可用):https://weibo.com/bigwhite20xx
  • 微博2:https://weibo.com/u/6484441286
  • 博客:tonybai.com
  • github: https://github.com/bigwhite
  • Gopher Daily归档 – https://github.com/bigwhite/gopherdaily
  • Gopher Daily Feed订阅 – https://gopherdaily.tonybai.com/feed

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com
这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats