标签 标准库 下的文章

Go 标准库将迎来 Zstandard:性能超越 Gzip,让你的应用更快、更省

本文永久链接 – https://tonybai.com/2025/11/08/proposal-zstd

大家好,我是Tony Bai。

在 Go 的世界里,一项被社区翘首以盼的提案在沉寂一年后,终于迎来了决定性的进展。2024 年,将 Zstandard 压缩算法纳入标准库的提案(#62513)被正式 Accept,但在那之后便鲜有动静。直到最近的 Go 编译器与运行时会议纪要中透露,这项工作将由社区的明星开发者 Klaus Post 主导推进。

这意味着,在未来的 Go 版本中,开发者将能开箱即用地获得一个官方维护、安全可靠且性能卓越的压缩工具。这不仅是对 Go 生态的一次重要补强,更将直接为无数 Go 应用带来性能提升、带宽节约和成本削减,真正实现“更快、更省”的承诺。

同时,这个提案背后曲折的历程——从激烈的技术选型辩论,到精雕细琢的 API 设计,再到因核心团队资源紧张而搁置,最终由社区力量重新激活——本身就是一幅展现 Go 生态演进的生动图景。

在本文中,我们将探讨 Zstandard 脱颖而出的技术优势,剖析其在工业界的成功案例,并揭示 compress/zstd 标准库从提案、API 设计到最终由社区力量重启的完整历程。

Zstandard:为何是它,而非其他?

在决定为标准库引入新的压缩算法时,Go 团队面临着众多选择。提案发起者 dsnet 在讨论中进行了一次精彩的“选美”,清晰地阐述了为何 Zstandard (Zstd) 能够脱颖而出:

  • Zstandard (Zstd): 由 Facebook (现 Meta) 开发并开源,拥有极佳的压缩/解压速度和出色的压缩比。更重要的是,它有正式的 RFC 规范(RFC 8878),这对于标准库实现的“正确性”至关重要。
  • Brotli: 同样优秀,但在设计上更偏向 Web 静态内容,且其庞大的静态字典(约 120KiB)与 Go 追求小体积静态二进制文件的哲学相悖。
  • XZ (LZMA): 拥有极高的压缩比,但代价是极其缓慢的压缩和解压速度,不适合通用场景。且缺乏正式的、明确的规范。
  • Snappy / LZ4: 追求极致的速度,但在压缩比上做出了巨大牺牲,应用场景相对小众。

Zstd 巧妙地结合了 LZ77 算法和一种名为 ANS (Asymmetric Numeral Systems) 的现代熵编码技术,在性能、压缩比和资源消耗之间取得了近乎完美的平衡,使其成为替代 Gzip 的“天选之子”。

注:截至Go 1.25.3版本,Go compress目录下提供了多种压缩算法的实现:bzip2实现了Burrows-Wheeler变换及霍夫曼编码;flate提供了DEFLATE算法核心,结合了LZ77和霍夫曼编码;gzip和zlib则分别将DEFLATE算法封装为gzip文件格式和zlib数据流格式;lzw实现了Lempel-Ziv-Welch算法。这些包共同为Go语言提供了多样化的数据压缩与解压缩能力。

注:Zstandard最新RFC规范为RFC 9659

工业界验证:Discord 与 Cloudflare 的性能飞跃

理论上的优势必须经过实践的检验。Zstd 在工业界的应用早已硕果累累。

  • **Discord 的 40% 带宽削减:** 通讯巨头 Discord 在将其实时网关的压缩算法从 zlib (Gzip) 迁移到流式 Zstandard 后,获得了惊人的收益。对于核心的 MESSAGE_CREATE 事件,压缩时间缩短了一半以上,负载体积也显著减小。这直接转化为更低的服务端 CPU 占用和客户端带宽节省,最终实现了 整体 Websocket 流量降低 40% 的壮举。

  • **Cloudflare 的容器镜像加速:** 在其全球容器平台上,Cloudflare 需要快速分发巨大的 AI 模型镜像(常超过 15GB)。通过将镜像层压缩算法从 Gzip 更换为 Zstd,一个 30GB 镜像的拉取时间从 8 分钟骤降至 4 分钟,速度翻倍,极大地提升了全球调度的灵活性和响应速度。

这些案例雄辩地证明,Zstd 是为现代高吞吐量、低延迟应用而生的。

API 设计的艺术:一场关于简洁、安全与未来的辩论

将新包引入标准库,API 的设计是重中之重。#62513 的讨论串完整记录了 compress/zstd API 从雏形到最终形态的演进过程。

核心原则:安全与一致性

提案伊始,就确立了两大基石:

  1. 安全优先: 标准库实现必须是纯 Go版本,不使用 unsafe 或汇编。dsnet 强调:“Go 社区调查一致显示,安全性比性能更重要。” 这意味着标准库版本追求的是可审查性、可维护性和跨平台的一致性,而非极致的性能。
  2. API 一致性: 新 API 应与 compress/gzip、compress/flate 等现有包保持风格统一,降低开发者的学习和迁移成本。

社区的声音:Klaus Post 的关键输入

在讨论中,github.com/klauspost/compress 系列库的作者 Klaus Post 扮演了关键角色。他的库是 Go 社区公认的最高性能压缩实现,其丰富的实战经验为标准库的设计提供了宝贵视角。

Klaus 指出,他自己的库 API 相对复杂,是因为支持多线程、异步等高级特性。他赞同标准库应剥离这些复杂性,提供一个完全同步的、线程安全的 API。同时,他也对字典(Dictionary)功能的 API 设计提出了深刻见解,强调了字典预处理的开销问题,这直接影响了后续 API 的设计。

最终定稿的 API

经过多轮讨论,由 Russ Cox (rsc) 总结并最终被接受的 API 形态如下(并非最终版):

package zstd

const (
    NoCompression      = 0
    BestSpeed          = 1
    BestCompression    = 9
    DefaultCompression = -1
)

type Dict struct { /* ... */ }
func ParseDict(enc []byte) (*Dict, error)
// ... 可能还包含 Marshal/Unmarshal 方法

type Reader struct { /* ... unexported fields ... */ }
func NewReader(r io.Reader) (*Reader, error)
func (z *Reader) Reset(r io.Reader) error
func (z *Reader) AddDict(*Dict)
func (z *Reader) SetRawDict([]byte)
func (z *Reader) Read(p []byte) (int, error)
func (z *Reader) Close() error

type Writer struct { /* ... unexported fields ... */ }
func NewWriter(w io.Writer) *Writer
func (z *Writer) Reset(w io.Writer)
func (z *Writer) SetLevel(int) error
func (z *Writer) AddDict(*Dict)
func (z *Writer) SetRawDict([]byte)
func (z *Writer) Write([]byte) (int, error)
func (z *Writer) Flush() error
func (z *Writer) Close() error

这个设计体现了 Go 标准库的哲学:

  • Setter 模式: 采用 SetLevel、AddDict 等方法进行配置,而不是更复杂的构造函数重载或函数式选项,兼顾了灵活性和简洁性。
  • 独立的 Dict 类型: 将字典抽象为 Dict 类型,通过 ParseDict 进行预处理。这解决了 Klaus 提出的“重复解析字典开销大”的问题,允许用户一次解析,多次复用。
  • 错误处理: 关键配置(如 SetLevel、ParseDict)返回 error,增强了 API 的健壮性。

漫长的等待与社区英雄的登场

提案于 2024 年被接受,为何直到 2025 年底才真正启动?这背后反映了 Go 核心团队面临的现实挑战。Go 团队规模精简,核心成员的精力需要分配给语言、编译器、运行时等更高优先级的任务。提案发起者 dsnet 也深度参与了 json/v2 等重大项目,无暇分身。

在此期间,Klaus Post 主动请缨,表示愿意贡献一个精简版的、符合标准库要求的实现。然而,这个提议在当时并未得到明确的推进信号。

转机出现在 2025 年 11 月的 Go 团队内部会议。纪要显示,团队终于有带宽来审查社区对 compress/flate 和 compress/zstd 的贡献。会议明确提到:“很高兴有社区审查。我们能去问问 k8s 的人吗?”(意指寻求更多社区的反馈和测试)。这标志着官方正式为 Klaus Post 的贡献打开了大门。随后Klaus Post也给出了自己的贡献时间表,大约在2026年Q1提交第一版实现给Go团队审查。

小结:一次迟到但意义非凡的升级

compress/zstd 的加入,对 Go 生态而言,是一次迟到但意义非凡的升级。它不仅仅是增加了一个功能包,更是一次:

  • 技术的现代化: 用一个在性能和效率上全面超越 Gzip 的现代算法,武装 Go 的标准库。
  • 生态的成熟: 将社区经过千锤百炼的最佳实践,以安全、稳健的方式融入官方标准。
  • 模式的探索: 展示了在核心团队资源有限的情况下,如何通过与社区领袖的协作,共同推动语言生态向前发展。

对于广大 Go 开发者来说,未来已来。不久之后(或许在 Go 1.27),我们将能以最简单、最 Go-like 的方式,为我们的应用插上 Zstandard 的翅膀,轻松实现性能提升与成本节约。这无疑是 Go 社区协作精神的又一次伟大胜利。

参考资料

  • https://github.com/golang/go/issues/62513
  • https://blog.cloudflare.com/container-platform-preview
  • https://discord.com/blog/how-discord-reduced-websocket-traffic-by-40-percent
  • https://www.rfc-editor.org/rfc/rfc8878

你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


想系统学习Go,构建扎实的知识体系?

我的新书《Go语言第一课》是你的首选。源自2.4万人好评的极客时间专栏,内容全面升级,同步至Go 1.24。首发期有专属五折优惠,不到40元即可入手,扫码即可拥有这本300页的Go语言入门宝典,即刻开启你的Go语言高效学习之旅!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

Go 技术沉思录:Java 26 年演进史给我们带来的启示

本文永久链接 – https://tonybai.com/2025/10/18/lessons-from-java-26-years-evolution

大家好,我是Tony Bai。

历史不会简单重复,但总是惊人地相似。编程语言的演化,如同一部波澜壮阔的史诗,充满了智慧的闪光、艰难的抉择与深刻的教训。

上月,资深工程师 Neil Madden 发表了一篇引人入胜的文章《点评 26 年的 Java 变更》,以一位亲历者的视角,犀利地回顾了这门“常青”语言的演进之路。

注:Neil Madden口中的Java 26年是指自他1999年学习Java编程开始到2025年的今天。

从Gopher视角来看,这并非一篇简单的技术评论,而是一次宝贵的以史为鉴的机会。

Java 作为企业级开发的“前浪”,其三十年的漫长的发展历程就像一本厚重的教科书,记录了在引入泛型、改进 I/O、简化并发等几乎所有重大议题上的探索与挣扎。

对于 Go 语言乃至整个软件工程领域而言,这其中蕴含着超越语言本身的普适性启示。本文并非旨在对比 Go 与 Java 的优劣,而是希望作为一部“技术沉思录”,通过 Java 这个案例,与各位一同探寻编程语言演进的内在规律。

启示一:核心特性的引入,时机与设计的艺术

Java 5 (2004) – 泛型 (Generics)

“as Go discovered on its attempt to speed-run Java’s mistakes all over again, if you don’t add generics from the start then you’ll have to retrofit them later, badly.”
(正如 Go 在其“快速重蹈 Java 覆辙”的尝试中发现的那样,如果你不从一开始就加入泛型,那么日后就不得不糟糕地进行弥补。)

Java 直到发布 8 年后才引入泛型。为了保持对海量存量代码的向后兼容性,它做出了一个影响深远的妥协:类型擦除 (type erasure)。这个决定虽然在当时解决了燃眉之急,却也带来了诸多“粗糙的边缘”,如反射处理困难、无法对泛型类型进行 instanceof 判断等,至今仍是 Java 开发者的痛点。

由此看来,语言核心特性的引入,是一场关于时机与设计的精妙艺术。过早引入,可能因设计不成熟而留下历史包袱;过晚引入,则必然会受到向后兼容性的掣肘,导致实现上的妥协。Java 的经验深刻地揭示了“后补”式设计的代价。

Go 语言在发布 12 年后才于1.18 版本引入泛型,同样面临巨大的兼容性压力。幸运的是,Go 团队得以借鉴 Java 的教训,选择了一条更艰难但更正确的道路——结合”Stenciling方案”和”Dictionaries方案”的“GC Shape Stenciling 方案”,在编译时间(二进制文件膨胀)以及运行时开销方面做了一个折中,并且没有类型擦除。这为 Go 泛型的未来发展奠定了更坚实的基础,也印证了一个原则:对于动摇语言根基的核心特性,宁愿慢,也要做对。

注:关于Go泛型实现机制的详细说明,请参见极客时间《Go语言第一课》的第41讲《驯服泛型:明确使用时机》。

启示二:API 是语言的“遗产”,其影响远超想象

Java 1.4 (2002) – “New” I/O (NIO)

“Provided non-blocking I/O for the first time, but really just a horrible API… Has barely improved in 2 and a half decades.”
(首次提供了非阻塞 I/O,但 API 简直糟透了……在 25 年里几乎没有任何改进。)

Neil 对 Java NIO 的评价毫不留情。他吐槽其 API 令人困惑,并且 inexplicably(莫名其妙地)使用 32 位有符号整数表示文件大小,将文件限制在 2GB 以内,这成为了 Java I/O 长期以来的一个“历史污点”。

这也印证了这样一条结论:标准库的 API 一旦发布,就成为语言最宝贵也最沉重的“遗产”。

一个设计精良的 API 可以赋能一代又一代的开发者,而一个糟糕的 API 则可能成为数十年都难以摆脱的枷锁。它定义了开发者与语言交互的方式,深刻地影响着生产力、代码质量和开发者的心智模型。

Go 语言从诞生之初就拥有一个设计极其精良的 I/O 模型。io.Reader 和 io.Writer 接口的简洁与强大,至今仍是语言设计的典范。Go 的网络库 net 基于操作系统提供的非阻塞 I/O(如 epoll),并通过 goroutine 将其巧妙地封装为同步阻塞的编程模型。这使得 Go 开发者既能享受非阻塞 I/O 的高性能,又无需陷入复杂的回调地狱。Java NIO 的“失误”深刻地提醒我们,在 API 设计上投入再多的思考也不为过。

启示三:将正确的并发模型内置于语言,是生产力的巨大飞跃

Java 5 (2004) – java.util.concurrent
Java 19 (2022) – 虚拟线程 (Virtual Threads)

Neil 对 Doug Lea 的 java.util.concurrent (J.U.C) 包给予了满分盛赞,认为其设计极其出色。然而,他也指出,在苦苦挣扎于各种复杂的异步编程模型多年后,Java 才终于通过 Project Loom 引入了虚拟线程,试图在 JVM 层面实现 M:N 的轻量级并发模型。

并发是现代软件开发的基石。一种语言如何处理并发,直接决定了其生产力的上限。Java 的演进路径——先提供一套强大的、专家级的底层并发工具(J.U.C),然后在多年后才引入一个更高层次、更易于大众使用的并发模型(虚拟线程)——揭示了一条从“提供工具”到“提供模型”的演进规律。

Go 语言在这一点上扮演了“预言家”的角色。它从诞生之初就将轻量级并发 (goroutine)通信 (channel) 作为语言的一等公民内置于运行时。这种 CSP (Communicating Sequential Processes) 模型,极大地简化了并发编程的心智负担。Go 的成功雄辩地证明了,将一个简单、强大的并发模型作为语言的核心特性,其带来的生产力飞跃,远非一个复杂的工具箱所能比拟。

启示四:警惕范围蔓延,敬畏生态兼容性

Java 8 (2014) – Streams API
Java 9 (2017) – 模块系统 (Modules)

Neil 对 Java Streams API 和模块系统给出了惊人的低分。他认为,Streams API 为了实现“看似简单”的并行计算而过度设计,变得复杂难用。而模块系统(Project Jigsaw)虽然初衷是解决 JAR 地狱,但其引入的巨大动荡和对现有生态的破坏性,使其得不偿失。

语言的演进充满了诱惑。一个好的特性,可能会因为被赋予了过多不相关的目标(范围蔓延)而变得臃肿不堪。任何试图“修正”语言底层生态的重大变革,都必须对生态兼容性抱有最大的敬畏。因为语言的生命力,最终源于其繁荣的社区和生态。

Go 在这方面也并非一帆风順。Go Modules 在诞生之初也曾引发巨大争议,但最终凭借其相对简洁的设计和 go 命令的强大集成能力,成功地统一了 Go 的依赖管理生态,其过程虽然有阵痛,但避免了 Java 模块系统那样的“大分裂”。Java 的这两个案例,为 Go 未来的任何重大变革都敲响了警钟。

小结:在巨人的肩膀上,继续沉思

回顾 Java 26 年的演进史,我们看到的不是一个失败者,而是一个不断自我革新、虽有失误但仍充满生命力的“巨人”。它的每一步探索,无论是成功还是失败,都为后来的语言(尤其是 Go)提供了宝贵的“启示录”。

Go 的幸运在于,它诞生得更晚,可以在“巨人的肩膀上”看得更远,从而在泛型、I/O 模型和并发等核心问题上,做出了更符合时代需求的设计。

然而,历史的镜子也照向未来。Go 如今也面临着自己的“沉思时刻”:如何平衡语言的简洁性与日益增长的表达力需求?如何演进标准库以适应新的挑战(这方面math/v2、json/v2做出了表率)?如何引入下一个可能具有破坏性的重大变革?

Java 的故事告诉我们,语言的演进是一场永无止境的马拉松。唯有保持谦逊,以史为鉴,并始终将开发者的真实需求和语言的内在哲学放在首位,才能在这场长跑中行稳致远。

资料链接:https://neilmadden.blog/2025/09/12/rating-26-years-of-java-changes/


你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats