当 Go 遇上 GPU:用 CUDA 释放千倍算力的实战指南
本文永久链接 – https://tonybai.com/2026/01/21/integrating-cuda-in-go 大家好,我是Tony Bai。 长期以来,高性能计算(HPC)和 GPU 编程似乎是 C++ 开发者的专属领地。Go 语言虽然在并发和服务端开发上表现卓越,但在触及 GPU 算力时,往往显得力不从心。 ...
本文永久链接 – https://tonybai.com/2026/01/21/integrating-cuda-in-go 大家好,我是Tony Bai。 长期以来,高性能计算(HPC)和 GPU 编程似乎是 C++ 开发者的专属领地。Go 语言虽然在并发和服务端开发上表现卓越,但在触及 GPU 算力时,往往显得力不从心。 ...
本文永久链接 – https://tonybai.com/2025/12/14/dont-let-ai-put-your-brain-cpu-in-wait 大家好,我是Tony Bai。 先问一个扎心的问题:当你给 ChatGPT、Cursor 或 Claude Code 发送了一个复杂的 Prompt 之后,接下来的 30 秒到 1 分钟里,你在干什么? ...
本文永久链接 – https://tonybai.com/2025/11/20/proposal-improve-goroutine-stack-using-page-faults 大家好,我是Tony Bai。 Go 语言的 goroutine 以其轻量和高效著称,而其背后一个关键的“魔法”便是可动态增长的栈 (Resizable Stacks)。然而,支撑这个魔法的机制——在几乎每个函数入口处插入的“栈检查”指令——也并非毫无代价。 ...
本文永久链接 – https://tonybai.com/2025/11/12/16-years-of-go-a-programming-language-built-to-last 大家好,我是Tony Bai。 每年的十一月,对于全球的 Gopher 而言,都是一个值得纪念的特殊时刻。今年,我们迎来了 Go 语言公开发布的第 16 个年头。 在众多的庆祝文章中,来自 Go 社区的知名组织 Ardan Labs 发布的这篇《Go 的 16 年:一门为持久而生的编程语言》,以其深邃的洞察力和饱满的情感,深深地打动了我们。 ...
本文永久链接 – https://tonybai.com/2025/11/08/proposal-zstd 大家好,我是Tony Bai。 在 Go 的世界里,一项被社区翘首以盼的提案在沉寂一年后,终于迎来了决定性的进展。2024 年,将 Zstandard 压缩算法纳入标准库的提案(#62513)被正式 Accept,但在那之后便鲜有动静。直到最近的 Go 编译器与运行时会议纪要中透露,这项工作将由社区的明星开发者 Klaus Post 主导推进。 ...
本文永久链接 – https://tonybai.com/2025/11/07/go-simple-illusion-easy-to-learn-hard-to-master 大家好,我是Tony Bai。 “Go 语言看起来如此简单,我的这种假设是错的吗?” 近日,一位刚接触 Go 几个月的新手在reddit golang论坛发出了这样一个真诚的提问。他感觉 Go “超级简单”,并好奇自己是否因为初学者的身份,而忽略了语言中那些“疯狂的复杂性”。 ...
本文永久链接 – https://tonybai.com/2025/10/22/seven-kubernetes-pitfalls 大家好,我是Tony Bai。 本文翻译自Kubernetes官方博客《7 Common Kubernetes Pitfalls (and How I Learned to Avoid Them)》一文。 这篇文章的作者Abdelkoddous Lhajouji 以第一人称视角,系统性地梳理了从资源管理、健康检查到安全配置等多个方面,新手乃至资深工程师都极易忽视的关键点。文中的每个“陷阱”都源于真实的生产经验,其规避建议更是极具实践指导意义。无论你是 K8s 初学者还是经验丰富的 SRE,相信都能从中获得启发,审视并改善自己的日常实践。 ...
本文永久链接 – https://tonybai.com/2025/09/07/the-power-of-an-interface-for-performance 我的《Go语言第一课》已上市,赠书活动正在进行中,欢迎点击此链接参与。 大家好,我是Tony Bai。 我们通常如何看待性能优化?答案往往是:更快的算法、更少的内存分配、更底层的并发原语、甚至用SIMD指令压榨CPU的每一个周期。我们痴迷于“引擎盖之下”的实现细节,坚信更好的代码和更强的硬件能带来更高的性能。 然而,TigerBeetle数据库创始人Joran Dirk Greef在Strange Loop上的一场精彩的演讲(https://www.youtube.com/watch?v=yKgfk8lTQuE),用一场耗资百万美元的数据库比赛,颠覆了这一传统认知。他通过无可辩驳的基准测试数据证明:在分布式系统中,接口(Interface)的设计,而非代码实现或硬件堆砌,才是决定性能上限的真正瓶颈。 在深入探讨之前,我们必须对本文的“接口”一词进行关键澄清。对于Go开发者而言,“接口”通常指代语言层面的interface类型,一种实现行为契约以及多态的工具。但本文中所说的“接口”,则是一个更宏观、更广义的概念,它指的是系统与系统之间、或用户与系统之间进行通信的交互模式、契约与协议。你的REST API设计、gRPC的.proto文件、微服务间的调用时序,都属于这个“广义接口”的范畴。 ...
本文永久链接 – https://tonybai.com/2025/08/22/go-simd-package-preview 大家好,我是Tony Bai。 多年以来,对于追求极致性能的 Go 开发者而言,心中始终有一个“痛点”:当算法需要压榨 CPU 的最后一点性能时,唯一的选择便是“下降”到手写汇编,这让利用 SIMD (Single Instruction, Multiple Data) 指令集提升程序性能这条路显得尤为陡峭难行。 ...
本文永久链接 – https://tonybai.com/2025/08/15/some-changes-in-go-1-25 大家好,我是Tony Bai。 北京时间2025年8月13日,Go 团队如期发布了 Go 语言的最新大版本——Go 1.25。按照惯例,每次 Go 大版本发布时,我都会撰写一篇“Go 1.x 中值得关注的几个变化”的文章。自 2014 年的 Go 1.4 版本起,这一系列文章已经伴随大家走过了十一个年头。 ...