Tony Bai - 一个程序员的心路历程

揭秘顶尖技术专家的15个关键方法与心态，不只靠代码

四月 13, 2025
0 条评论

本文永久链接 – https://tonybai.com/2025/04/13/top-programmers-methods-mindset

这可能是我看到的关于‘如何成为顶尖程序员’最深刻的总结之一！

在快速迭代的技术世界里，每一位开发者或许都曾思考：是什么区分了“优秀”与“卓越”？仅仅是掌握了最新的框架或语言吗？Matthias Endler在他广受关注的文章《我所认识的最优秀的程序员》中，基于多年的观察，提炼出了那些真正顶尖的工程师们所共有的特质与习惯。这并非一份简单的技能清单，而更像是一份关于技术匠心、持续成长和专业心态的深度指南。在这篇文章中，我门将一同探索这些宝贵的洞见，希望能为你我的技术之路带来启发。

要深入理解顶尖程序员的与众不同之处，我们首先需要探究他们是如何构建坚实的技术基础，以及在日常工作中如何对待最基本的技术细节。

夯实基础：深度理解与精准调试

卓越并非空中楼阁，它建立在对一手资料和工具的深刻理解和对错误的精准把握之上。

深入理解工具 (Know Your Tools Well): 顶尖开发者追求对所用技术的基本原理的深刻理解（Grokking），这远超仅仅“会用”的层面。一个普通用户可能会在使用中磕磕绊绊、感到困惑、甚至用错方法而忽略优化。而专家则追求透彻理解，他们能够自信地写出配置，理解其中每一行的含义并能向同事解释清楚，不留任何疑问。要真正做到“深入了解”一个工具，你需要掌握它的：
- 历史: 谁创造了它？为何创造？旨在解决什么问题？了解背景有助于把握其设计哲学。
- 现状: 谁在维护？他们在哪里工作？当前开发的重点是什么？这关乎其发展方向和稳定性。
- 局限: 何时不适用？它的边界条件和可能失效的场景是什么？知其短板才能扬长避短。
- 生态: 有哪些关键的库或插件？社区活跃度如何？谁在广泛使用它？生态决定了其生命力和可扩展性。
- 正如文中所举的例子：如果你是一名重度使用 Kafka 的后端工程师，成为顶尖人才意味着你需要对 Kafka 有着系统和深入的认知，而非仅仅依赖于论坛上的零散信息。
阅读原始文档 (Read the Reference): 遇到问题时，他们的第一反应往往不是求助于Stack Overflow或LLM，而是直奔官方文档、规范或源代码。无论是Apache的配置、Python标准库，还是TOML 规范，他们相信第一手资料的价值。这种习惯让他们能够自信地配置工具的每一行参数，并清晰地解释其原因。深入了解技术的历史（Why）、现状（Who & What）和局限性（When not to use）是他们专业性的体现。如果你重度依赖Kafka，那么对Kafka的深入了解就应该是你的基本功。
细读错误信息 (Read The Error Message): 面对错误，他们不会惊慌失措或随意猜测，而是会真正地、深入地阅读错误信息，尝试理解其背后的含义。他们相信，错误信息本身就蕴含了解决问题的线索。这种从细微处推理的能力，让他们能够独立解决大部分问题，甚至在帮助他人时展现出惊人的洞察力。
拒绝猜测 (Don’t Guess): “面对模棱两可，拒绝猜测的诱惑”——《Python之禅》中的这条原则被顶尖开发者奉为圭臬。猜测可能会暂时“解决”问题，但错误的假设会构建脆弱的认知模型，遗患无穷。他们宁愿花费更多时间去问询、查阅资料、使用调试器，也要确保自己基于确凿的事实进行判断和行动。

掌握了扎实的基础知识固然重要，但真正的挑战往往在于如何运用这些知识去解决现实世界中的复杂问题。卓越的工程师在这方面同样展现出非凡的能力。

攻坚克难：拆解问题与拥抱挑战

拥有扎实的基础后，真正的较量在于如何面对并征服技术难题。解决复杂问题的能力，是衡量工程师价值的核心标尺。

分解问题 (Break Down Problems): 面对棘手的难题，卓越工程师的核心策略是将其分解为更小、更易于管理的部分。这需要经验，也需要优秀的解决问题的技巧。他们懂得，将大问题拆解成一系列小问题逐一攻破，最终会发现原本看似不可能的任务变得可行。这正是专业开发工作的核心价值所在。
勇于实践 (Don’t Be Afraid To Get Your Hands Dirty): 他们从不畏惧接触陌生的代码库或技术栈，不会轻易说“这不归我管”或“我帮不了你”。相反，他们会主动深入其中，通过阅读和修改代码来学习。这种勇于探索和实践的态度，使他们能够快速掌握新技能，并最终成为团队中不可或缺的关键人物，仅仅因为他们是那些“敢于动手”的人。
保持简洁 (Keep It Simple): 聪明的工程师可能会写出复杂的代码，但卓越的工程师追求编写简洁的代码。他们深知，在大多数情况下，简单即是最好，因为它更易于理解、维护和扩展。懂得在复杂度和实用性之间做出明智取舍，是区分顶尖人才的重要标志。

主动解决问题的能力令人钦佩，然而，是什么支撑着顶尖开发者在漫长的职业生涯中始终保持敏锐和活力呢？答案往往隐藏在他们独特的思维模式和对成长的持续追求之中。

成长心态：持续学习与谦逊求知

技术能力之外，是什么支撑着顶尖开发者持续进步？关键在于永恒的成长心态和对知识的敬畏。 技术日新月异，唯有持续学习和开放心态才能立于不败之地。

永不止步的学习 (Never Stop Learning): 许多顶尖开发者，即使年逾花甲，依然保持着对新知识的好奇心和学习热情。他们不会固守陈规，而是持续评估新技术的价值。即使决定不采用某项新技术，他们也能清晰地阐述原因、适用场景及替代方案。这种开放和批判性的学习态度，让他们始终保持思维的敏锐和知识的更新。
地位无关紧要 (Status Doesn’t Matter): 他们乐于与任何人交流，无论是首席工程师还是初级开发者。他们相信每个人身上都有值得学习的地方，尤其是新人往往能带来不受“历史包袱”束缚的新鲜视角和创意。
耐心是美德 (Have Patience): 无论是面对行为“怪异”的计算机，还是需要时间学习成长的同事，耐心都是不可或缺的品质。顶尖开发者明白，问题总有逻辑可循，他人只是信息不全。缺乏耐心只会让人陷入抱怨和挫败。专注、投入和耐心是解决难题、推动项目和维系团队的关键。
永不归咎于计算机 (Never Blame the Computer): 面对看似随机或无法解释的 Bug，他们坚信背后必有逻辑原因，只是尚未找到。他们会持续挖掘，直到找到根源。这种承担责任、刨根问底的态度，是他们能够不断进步和深入理解系统的基础。
勇于承认未知 (Don’t Be Afraid to Say “I Don’t Know”): 承认“我不知道”并非示弱，而是诚实和学习的起点。顶尖的开发者从不害怕暴露自己的知识边界，他们知道这是提出问题、进行推导和学习新知的契机。拒绝不懂装懂，是建立信任和实现真正成长的基础。

技术上的精进和持续成长的内在驱动力是成为顶尖开发者的核心要素，但他们的影响力往往超越了个人代码的范畴。卓越工程师深知协作与分享的力量，并以此来放大自身价值。

协作与影响力：乐于助人，善于表达

顶尖的技术实力若想产生更广泛的影响，离不开有效的协作、清晰的表达和积极的知识分享。卓越工程师的影响力，往往超越其个人代码产出。

乐于助人 (Always Help Others): 尽管自身工作繁忙，他们通常都乐于向他人伸出援手。这种天生的好奇心和乐于助人的精神，不仅帮助了他人，也促使他们自身不断思考和学习，是他们成为优秀工程师的重要因素。拥有这样的成员，对任何团队来说都是巨大的财富。
写作即思考 (Write): 大多数顶尖工程师都具备良好的沟通能力，并且乐于分享知识。写作（博客、文档、演讲稿等）是他们整理思路、沉淀知识并扩大影响力的重要方式。清晰的写作往往反映了清晰的思维逻辑，这与其代码风格常常是相辅相成的。
建立声誉 (Build a Reputation): 做好工作是基础，但让你的工作成果被认可，才能真正扩大你的影响力。无论是构建关键系统、开发流行工具、贡献开源项目还是著书立说，都是建立声誉的方式。声誉的建立是一个长期投入的过程，它能让你接触到更有挑战的项目，吸引更多合作者，最终“规模化”你的积极影响。

从深入理解基础到攻坚克难，从保持成长心态到积极协作与分享，这些关键特质共同描绘了顶尖技术专家的画像。

小结

成为一名顶尖的程序员，并非一蹴而就，也无关天赋异禀。正如Matthias Endler在文章中所揭示的，这更关乎一系列刻意培养的习惯、严谨的思维方式和持续精进的专业态度。从深入理解基础，到勇于面对挑战，再到保持谦逊学习和积极协作，这些特质共同构筑了卓越工程师的画像。

这并非一份僵化的检查清单，而是一面镜子，映照出我们可以在日常工作中不断打磨和提升的方向。愿这些来自顶尖开发者实践的启示，能激励我们在技术的道路上走得更远、更稳健。

原文链接: The Best Programmers I Know | Matthias Endler — https://endler.dev/2025/best-programmers

你认为顶尖开发者最重要的特质是什么？欢迎在评论区分享你的观点。

加入「Go & AI 精进营」知识星球，开启你的技术跃迁之旅！

我们致力于打造一个高品质的 Go 语言深度学习 与 AI 应用探索 平台。在这里，你将获得：

体系化 Go 核心进阶内容: 深入「Go原理课」、「Go进阶课」、「Go避坑课」等独家深度专栏，夯实你的 Go 内功。
前沿 Go+AI 实战赋能: 紧跟时代步伐，学习「Go+AI应用实战」、「Agent开发实战课」，掌握 AI 时代新技能。
星主 Tony Bai 亲自答疑: 遇到难题？星主第一时间为你深度解析，扫清学习障碍。
高活跃 Gopher 交流圈: 与众多优秀 Gopher 分享心得、讨论技术，碰撞思想火花。
独家资源与内容首发: 技术文章、课程更新、精选资源，第一时间触达。

衷心希望「Go & AI 精进营」能成为你学习、进步、交流的港湾。让我们在此相聚，享受技术精进的快乐！欢迎你的加入！

img{512x368}

著名云主机服务厂商DigitalOcean发布最新的主机计划，入门级Droplet配置升级为：1 core CPU、1G内存、25G高速SSD，价格6$/月。有使用DigitalOcean需求的朋友，可以打开这个链接地址：https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

Gopher Daily(Gopher每日新闻) – https://gopherdaily.tonybai.com

我的联系方式：

微博(暂不可用)：https://weibo.com/bigwhite20xx
微博2：https://weibo.com/u/6484441286
博客：tonybai.com
github: https://github.com/bigwhite
Gopher Daily归档 – https://github.com/bigwhite/gopherdaily
Gopher Daily Feed订阅 – https://gopherdaily.tonybai.com/feed

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

Go开发者必看！Uber如何利用PGO将Go服务性能优化推向新高度？

四月 11, 2025
0 条评论

本文永久链接 – https://tonybai.com/2025/04/11/uber-go-pgo-optimization

对于像Uber这样广泛采用Go语言（Uber 60%的CPU资源都用于支撑Go服务运行）的科技巨头而言，性能优化不仅关乎用户体验，更直接影响着运营成本。继多年前通过GOGC调优节省7万CPU核心后，Uber近期再次发力，分享了其在大规模Go服务中部署Profile-Guided Optimization (PGO) 的实践经验，并通过自动化框架和工具创新，克服了关键挑战，实现了显著的性能收益。在这篇文章中，我就来介绍一下Uber的PGO优化之旅，供大家参考。

1. PGO：Go近几个版本持续投入的性能优化手段

Profile-Guided Optimization (PGO)，即配置文件引导的优化，是一种利用程序实际运行时的性能分析数据（Profile）来指导编译器进行优化的技术。相比传统的静态分析和启发式规则，PGO能够让编译器更精准地识别热点代码路径、函数调用频率、分支预测等，从而做出更优的优化决策，例如：

更智能的函数内联(Inlining): 基于实际调用频率，更精确地决定内联哪些“热”函数，即便这些函数在常规编译时可能不会被内联，从而减少函数调用开销。
接口调用的去虚拟化(Devirtualization): 在PGO数据表明接口变量在运行时通常指向特定具体类型时，可以将动态派发转换为更高效的直接调用。
优化的代码布局: 通过基本块重排、函数分割、函数重排等，改善指令缓存（iCache）和TLB的命中率，减少CPU前端停顿。

Go语言自Go 1.20版本开始引入对PGO的支持（最初侧重于内联优化），并在Go 1.21中，PGO实现生产可用，并增加了PGO驱动的去虚拟化(Devirtualization)。这表明Go官方对利用运行时信息提升性能的重视以及持续的投入。并且，通过用户的实际体验报告来看，PGO的确可以在一定程度上改善Go应用的性能，在Go 1.21及后续版本中，启用PGO 后，工作负载的性能常会有2%到7%的提升。

不过此前一直缺少来自大厂对PGO实践效果的声音，而Uber恰恰满足了Go社区的这个需求。

2. Uber的大规模PGO实践：自动化与挑战

面对数千个Go微服务，Uber在内部构建了一个持续优化的PGO框架：

其流程大致如下：

持续性能分析: 每日自动收集生产环境中多个服务实例的pprof CPU profiles。
配置文件聚合: 将收集到的profiles进行合并，生成具有代表性的服务性能画像。
服务注册: 通过配置系统，选择性地为特定服务开启PGO编译。
CI/CD 集成: 在持续集成环节，使用-pgo标志和生成的profile文件编译Go服务。
部署与监控: 将PGO优化的二进制文件部署到生产环境，并通过监控仪表盘追踪性能变化。

然而，大规模推广PGO并非一帆风顺。Uber很快遇到了一个关键挑战：启用PGO后，部分服务的编译时间急剧增加，最高可达8倍！这严重影响了开发和部署效率。

通过深入分析，团队发现根源在于Go编译器在为每个包编译时，都需要重复读取和解析完整的pprof文件，这在高并发的构建系统中造成了巨大的I/O和CPU开销，占据了PGO编译流程中高达95%的时间。

如何解决这个问题呢？我们接着看Uber工程师的创新方案。

3. 破局：创新的Profile预处理工具

为了解决编译耗时的瓶颈，Uber与Google Go编译器团队合作，开发并向上游贡献了一个profile预处理工具（该功能已集成到Go 1.23）。

这个工具的核心思想是“一次解析，多次使用”。它能够独立运行，提前读取原始的pprof文件，并解析profile数据以提取函数调用关系和频率信息。关键信息被转换并缓存为一种紧凑的中间格式（WeightedCallGraph，或加权调用图），使得Go编译器可以直接读取这种轻量级的中间格式，无需再解析庞大的pprof文件，从而显著降低编译开销。

在Uber内部部署该预处理工具并每日更新预处理后的profile后，有效解决了PGO带来的编译时间增加问题，大部分服务的编译耗时恢复到了接近优化前的水平，为PGO的大规模应用铺平了道路。

既然问题解决了，那PGO优化带来的最终效果如何呢？下面就来揭晓答案。

4. PGO的性能影响：实证与观察

虽然在Uber复杂的生产环境中精确衡量PGO的独立影响（排除流量波动、自动伸缩、代码变更等因素）存在挑战，但他们的分析依然揭示了PGO的价值。他们分别观察了基准测试的结果以及生产环境的结果。

合成基准测试

在流行的go-json库基准测试中，PGO带来了平均12% 的性能提升，部分微基准测试提升超过20%。观察发现，PGO显著降低了30%以上的iTLB misses，并能内联一些因体积过大而被默认启发式规则忽略的热点函数（如checkValid）。在tally指标库基准测试中，PGO也带来了平均10% 的性能提升，部分测试超过50%。

生产环境观察

通过对比启用PGO前后7天的性能数据，Uber对其Top 6的Go服务进行了分析。结果显示，启用PGO后，这些服务的CPU核心分配数出现了可见的下降趋势。综合估算，PGO优化（主要是内联改进）在这些顶级服务中贡献了约4% 的性能增益，相当于节省了约24,000个CPU核心。

此外，通过对比 PGO 前后的profile火焰图，可以确认PGO确实内联了之前未被内联的关键热点函数，验证了性能提升主要来源于PGO优化。

5. GOGC调优回顾：Uber的优化基因

值得一提的是，PGO并非Uber在Go性能优化上的首次大规模尝试。

多年前，他们通过名为GOGCTuner的内部工具，解决了Go GC（垃圾回收）在大量服务中CPU占用过高的问题。默认的GOGC=100策略对于内存使用模式多样且运行在有内存限制容器中的服务并非最优，容易导致GC过于频繁或存在OOM风险。

为此，Uber开发了GOGCTuner库，能够根据容器的cgroup内存限制动态调整GOGC值，例如设定一个内存使用上限百分比（如70%），以在保证内存安全的前提下尽可能减少GC次数，从而降低CPU开销。该工具巧妙地利用runtime.SetFinalizer实现了低开销的GC事件触发调整机制，最终为Uber节省了约70000个CPU核心。具体内容可以参见本文参考资料中的”How We Saved 70K Cores Across 30 Mission-Critical Services”一文。

从GOGC调优到PGO自动化，也体现了Uber在Go性能优化领域持续投入和系统化解决问题的工程文化。

6. 小结

Uber的实践清晰地表明，PGO是Go性能优化的一个强大武器，尤其对于CPU密集型或具有复杂调用关系的应用。虽然大规模应用PGO会遇到挑战（如编译时间），但通过工具创新（如Go 1.23集成的profile预处理功能）是完全可以克服的。

对于广大Go开发者而言，关注PGO显得尤为重要。随着Go版本的迭代，PGO的能力和易用性也在不断提升，了解并尝试在自己的项目中应用PGO，可能会带来意想不到的性能收益。

Go 1.23及以后版本集成的PGO预处理能力，大大降低了PGO的使用门槛，有效解决了编译耗时的主要痛点。同时，学习Uber系统化、数据驱动的性能优化方法论，从GC调优到PGO，能够帮助开发者持续挖掘性能潜力。

Go社区与像Uber这样的大规模实践者之间的良性互动（问题发现、解决方案到上游贡献）正在不断推动Go语言及其工具链走向成熟和高效。我们期待看到更多Go应用通过PGO等先进优化技术实现性能的新突破。

本文内容主要基于Uber Engineering Blog的两篇文章(见参考资料列表)，特别感谢Uber工程师团队（包括前成员Jin Lin、Raj Barik等）以及Google Go编译器团队（Michael Pratt、Cherry Mui、Austin Clements等）在PGO领域的探索、实践和分享。

你对在项目中使用PGO有什么看法或疑问吗？欢迎留言讨论！

7. 参考资料

Automating Efficiency of Go programs with Profile-Guided Optimizations – https://www.uber.com/blog/automating-efficiency-of-go-programs-with-pgo
How We Saved 70K Cores Across 30 Mission-Critical Services – https://www.uber.com/blog/how-we-saved-70k-cores-across-30-mission-critical-services
Adopting Arm at Scale: Transitioning to a Multi-Architecture Environment – https://www.uber.com/blog/adopting-arm-at-scale-transitioning-to-a-multi-architecture-environment

Gopher部落知识星球在2025年将继续致力于打造一个高品质的Go语言学习和交流平台。我们将继续提供优质的Go技术文章首发和阅读体验。并且，2025年将在星球首发“Gopher的AI原生应用开发第一课”、“Go陷阱与缺陷”和“Go原理课”专栏！此外，我们还会加强星友之间的交流和互动。欢迎大家踊跃提问，分享心得，讨论技术。我会在第一时间进行解答和交流。我衷心希望Gopher部落可以成为大家学习、进步、交流的港湾。让我相聚在Gopher部落，享受coding的快乐! 欢迎大家踊跃加入！

img{512x368}