标签 github 下的文章

Go 标准库将迎来 Zstandard:性能超越 Gzip,让你的应用更快、更省

本文永久链接 – https://tonybai.com/2025/11/08/proposal-zstd

大家好,我是Tony Bai。

在 Go 的世界里,一项被社区翘首以盼的提案在沉寂一年后,终于迎来了决定性的进展。2024 年,将 Zstandard 压缩算法纳入标准库的提案(#62513)被正式 Accept,但在那之后便鲜有动静。直到最近的 Go 编译器与运行时会议纪要中透露,这项工作将由社区的明星开发者 Klaus Post 主导推进。

这意味着,在未来的 Go 版本中,开发者将能开箱即用地获得一个官方维护、安全可靠且性能卓越的压缩工具。这不仅是对 Go 生态的一次重要补强,更将直接为无数 Go 应用带来性能提升、带宽节约和成本削减,真正实现“更快、更省”的承诺。

同时,这个提案背后曲折的历程——从激烈的技术选型辩论,到精雕细琢的 API 设计,再到因核心团队资源紧张而搁置,最终由社区力量重新激活——本身就是一幅展现 Go 生态演进的生动图景。

在本文中,我们将探讨 Zstandard 脱颖而出的技术优势,剖析其在工业界的成功案例,并揭示 compress/zstd 标准库从提案、API 设计到最终由社区力量重启的完整历程。

Zstandard:为何是它,而非其他?

在决定为标准库引入新的压缩算法时,Go 团队面临着众多选择。提案发起者 dsnet 在讨论中进行了一次精彩的“选美”,清晰地阐述了为何 Zstandard (Zstd) 能够脱颖而出:

  • Zstandard (Zstd): 由 Facebook (现 Meta) 开发并开源,拥有极佳的压缩/解压速度和出色的压缩比。更重要的是,它有正式的 RFC 规范(RFC 8878),这对于标准库实现的“正确性”至关重要。
  • Brotli: 同样优秀,但在设计上更偏向 Web 静态内容,且其庞大的静态字典(约 120KiB)与 Go 追求小体积静态二进制文件的哲学相悖。
  • XZ (LZMA): 拥有极高的压缩比,但代价是极其缓慢的压缩和解压速度,不适合通用场景。且缺乏正式的、明确的规范。
  • Snappy / LZ4: 追求极致的速度,但在压缩比上做出了巨大牺牲,应用场景相对小众。

Zstd 巧妙地结合了 LZ77 算法和一种名为 ANS (Asymmetric Numeral Systems) 的现代熵编码技术,在性能、压缩比和资源消耗之间取得了近乎完美的平衡,使其成为替代 Gzip 的“天选之子”。

注:截至Go 1.25.3版本,Go compress目录下提供了多种压缩算法的实现:bzip2实现了Burrows-Wheeler变换及霍夫曼编码;flate提供了DEFLATE算法核心,结合了LZ77和霍夫曼编码;gzip和zlib则分别将DEFLATE算法封装为gzip文件格式和zlib数据流格式;lzw实现了Lempel-Ziv-Welch算法。这些包共同为Go语言提供了多样化的数据压缩与解压缩能力。

注:Zstandard最新RFC规范为RFC 9659

工业界验证:Discord 与 Cloudflare 的性能飞跃

理论上的优势必须经过实践的检验。Zstd 在工业界的应用早已硕果累累。

  • **Discord 的 40% 带宽削减:** 通讯巨头 Discord 在将其实时网关的压缩算法从 zlib (Gzip) 迁移到流式 Zstandard 后,获得了惊人的收益。对于核心的 MESSAGE_CREATE 事件,压缩时间缩短了一半以上,负载体积也显著减小。这直接转化为更低的服务端 CPU 占用和客户端带宽节省,最终实现了 整体 Websocket 流量降低 40% 的壮举。

  • **Cloudflare 的容器镜像加速:** 在其全球容器平台上,Cloudflare 需要快速分发巨大的 AI 模型镜像(常超过 15GB)。通过将镜像层压缩算法从 Gzip 更换为 Zstd,一个 30GB 镜像的拉取时间从 8 分钟骤降至 4 分钟,速度翻倍,极大地提升了全球调度的灵活性和响应速度。

这些案例雄辩地证明,Zstd 是为现代高吞吐量、低延迟应用而生的。

API 设计的艺术:一场关于简洁、安全与未来的辩论

将新包引入标准库,API 的设计是重中之重。#62513 的讨论串完整记录了 compress/zstd API 从雏形到最终形态的演进过程。

核心原则:安全与一致性

提案伊始,就确立了两大基石:

  1. 安全优先: 标准库实现必须是纯 Go版本,不使用 unsafe 或汇编。dsnet 强调:“Go 社区调查一致显示,安全性比性能更重要。” 这意味着标准库版本追求的是可审查性、可维护性和跨平台的一致性,而非极致的性能。
  2. API 一致性: 新 API 应与 compress/gzip、compress/flate 等现有包保持风格统一,降低开发者的学习和迁移成本。

社区的声音:Klaus Post 的关键输入

在讨论中,github.com/klauspost/compress 系列库的作者 Klaus Post 扮演了关键角色。他的库是 Go 社区公认的最高性能压缩实现,其丰富的实战经验为标准库的设计提供了宝贵视角。

Klaus 指出,他自己的库 API 相对复杂,是因为支持多线程、异步等高级特性。他赞同标准库应剥离这些复杂性,提供一个完全同步的、线程安全的 API。同时,他也对字典(Dictionary)功能的 API 设计提出了深刻见解,强调了字典预处理的开销问题,这直接影响了后续 API 的设计。

最终定稿的 API

经过多轮讨论,由 Russ Cox (rsc) 总结并最终被接受的 API 形态如下(并非最终版):

package zstd

const (
    NoCompression      = 0
    BestSpeed          = 1
    BestCompression    = 9
    DefaultCompression = -1
)

type Dict struct { /* ... */ }
func ParseDict(enc []byte) (*Dict, error)
// ... 可能还包含 Marshal/Unmarshal 方法

type Reader struct { /* ... unexported fields ... */ }
func NewReader(r io.Reader) (*Reader, error)
func (z *Reader) Reset(r io.Reader) error
func (z *Reader) AddDict(*Dict)
func (z *Reader) SetRawDict([]byte)
func (z *Reader) Read(p []byte) (int, error)
func (z *Reader) Close() error

type Writer struct { /* ... unexported fields ... */ }
func NewWriter(w io.Writer) *Writer
func (z *Writer) Reset(w io.Writer)
func (z *Writer) SetLevel(int) error
func (z *Writer) AddDict(*Dict)
func (z *Writer) SetRawDict([]byte)
func (z *Writer) Write([]byte) (int, error)
func (z *Writer) Flush() error
func (z *Writer) Close() error

这个设计体现了 Go 标准库的哲学:

  • Setter 模式: 采用 SetLevel、AddDict 等方法进行配置,而不是更复杂的构造函数重载或函数式选项,兼顾了灵活性和简洁性。
  • 独立的 Dict 类型: 将字典抽象为 Dict 类型,通过 ParseDict 进行预处理。这解决了 Klaus 提出的“重复解析字典开销大”的问题,允许用户一次解析,多次复用。
  • 错误处理: 关键配置(如 SetLevel、ParseDict)返回 error,增强了 API 的健壮性。

漫长的等待与社区英雄的登场

提案于 2024 年被接受,为何直到 2025 年底才真正启动?这背后反映了 Go 核心团队面临的现实挑战。Go 团队规模精简,核心成员的精力需要分配给语言、编译器、运行时等更高优先级的任务。提案发起者 dsnet 也深度参与了 json/v2 等重大项目,无暇分身。

在此期间,Klaus Post 主动请缨,表示愿意贡献一个精简版的、符合标准库要求的实现。然而,这个提议在当时并未得到明确的推进信号。

转机出现在 2025 年 11 月的 Go 团队内部会议。纪要显示,团队终于有带宽来审查社区对 compress/flate 和 compress/zstd 的贡献。会议明确提到:“很高兴有社区审查。我们能去问问 k8s 的人吗?”(意指寻求更多社区的反馈和测试)。这标志着官方正式为 Klaus Post 的贡献打开了大门。随后Klaus Post也给出了自己的贡献时间表,大约在2026年Q1提交第一版实现给Go团队审查。

小结:一次迟到但意义非凡的升级

compress/zstd 的加入,对 Go 生态而言,是一次迟到但意义非凡的升级。它不仅仅是增加了一个功能包,更是一次:

  • 技术的现代化: 用一个在性能和效率上全面超越 Gzip 的现代算法,武装 Go 的标准库。
  • 生态的成熟: 将社区经过千锤百炼的最佳实践,以安全、稳健的方式融入官方标准。
  • 模式的探索: 展示了在核心团队资源有限的情况下,如何通过与社区领袖的协作,共同推动语言生态向前发展。

对于广大 Go 开发者来说,未来已来。不久之后(或许在 Go 1.27),我们将能以最简单、最 Go-like 的方式,为我们的应用插上 Zstandard 的翅膀,轻松实现性能提升与成本节约。这无疑是 Go 社区协作精神的又一次伟大胜利。

参考资料

  • https://github.com/golang/go/issues/62513
  • https://blog.cloudflare.com/container-platform-preview
  • https://discord.com/blog/how-discord-reduced-websocket-traffic-by-40-percent
  • https://www.rfc-editor.org/rfc/rfc8878

你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


想系统学习Go,构建扎实的知识体系?

我的新书《Go语言第一课》是你的首选。源自2.4万人好评的极客时间专栏,内容全面升级,同步至Go 1.24。首发期有专属五折优惠,不到40元即可入手,扫码即可拥有这本300页的Go语言入门宝典,即刻开启你的Go语言高效学习之旅!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

致敬 1024 程序员节:写给奔跑在二进制世界里的你 (文末赠书)

本文永久链接 – https://tonybai.com/2025/10/24/honoring-1024-programmers-day

大家好,我是Tony Bai。

今天,10 月 24 日,是一个特殊的日子。

它并非法定假日,地图上也没有标注。但对于一群特定的人来说,这个日期本身,就是一种无需言说的默契。1024,是 2 的 10 次方,是 1KB,是我们构建整个数字世界的基石。

它,就是属于我们程序员自己的节日——1024 程序员节

所以,今天这篇文章,不聊源码,不谈架构,只想写给每一个奔跑在二进制世界里的你:

  • 致敬那些深夜里,与 Bug 搏斗到天明的执着身影;
  • 致敬那些显示器前,在 0 和 1 中创造出无限可能的大脑;
  • 致敬那些用一行行代码,默默改变着世界的同行者们。

你们,值得被看见,被理解,被尊重。

程序员的宿命:永远在学习“第一课”

作为程序员,我们的职业生涯,似乎就是一场永无止境的“学习第一课”的旅程。

我至今仍记得自己第一次学习 C 语言时,面对指针的困惑;第一次接触并发编程时,被死锁折磨的痛苦;第一次探索 Go 语言时,被其简单哲学所震撼的喜悦。

无论是学习一门新语言,还是掌握一个新框架,亦或是理解一种新的架构思想,我们总是在不断地“清空自己”,以一个初学者的心态,回到“第一课”的起点。

这正是这个职业最磨人、也最迷人的地方。它强迫我们保持好奇,持续奔跑,永不僵化

我将我的极客时间专栏《Go语言第一课》沉淀成书,正是源于对这份“程序员宿命”的深刻理解。我希望它不仅仅是教你一门语言的语法,更是想为你提供一套坚实的、可信赖的、能够举一反三的学习体系和思维范式。它是我作为一个“长期主义”布道者,希望能为你的下一段“第一课”之路,铺下的一块最坚固的基石。

灵魂拷问:AI 时代,我们还需要“第一课”吗?

我知道,很多人心里都有一个疑问:在 AI 如此强大的今天,我们似乎可以随时跳过所有“第一课”,直接向 AI 要答案。那么,系统性的学习是否已经过时

作为一名同样深度使用 AI 的工程师,我的答案是:不,恰恰相反,在这个时代,扎实的“第一课”比以往任何时候都更加重要。

AI 是“陪练”,不是“内功心法”。 它可以极大地加速我们实现想法的过程,但它无法替代我们建立知识体系的“内功”修炼。它能告诉你“是什么”,却很少能告诉你“为什么”。

我看到太多的初级工程师,在 AI 带来的“我什么都行”的幻觉中,陷入了“知其然,不知其所以然”的困境。这种“能力空心化”,会在未来的某个时刻,成为职业生涯中难以逾越的瓶颈。

而系统性地学习一本好的入门书,正是在 AI 时代对抗这种“能力空心化”、构建自己不可替代核心竞争力的最佳途径。它强迫你去理解代码背后的设计哲学、核心原理和权衡取舍,而这些,恰恰是 AI 无法生成的、属于你自己的智慧。

节日献礼:送你一本签名的《Go语言第一课》!

在这个属于我们自己的节日里,我想用一份最“硬核”的礼物,来回馈大家一直以来的支持,也为每一位仍在奔跑的同行者,加一次油,充一次电。

我准备了 2 本我的亲笔签名版《Go语言第一课》,送给我的读者们。

【参与方式】

点击此链接进入我的公众号文章,分享文章,转发朋友圈,并在本文评论区留言说说你作为程序员最难忘的一个瞬间/故事,或者你对程序员这个职业最深的思考

它可以是一次通宵排查 Bug 后的豁然开朗,可以是自己的代码被千万用户使用时的成就感,也可以是对这个行业未来的迷茫与期许。

【抽奖规则】

我将从所有留言中,精选 2 条最走心、最能打动我的分享,每人赠送一本我的亲笔签名版《Go语言第一课》

【活动截止时间】

2025年10月31日 23:59

期待在留言区,看到你的故事。

行动号召:为你的热爱,充一次电!

当然,节日的福利属于每一个人。

如果你不想等待抽奖,或者想把这份礼物送给身边正在学习 Go 的朋友,现在就是最好的时机。双十一促销已经启动,各大电商平台的五折购书折扣都是全年最低。不到 40 元,即可拥有这本经过 2.4w 人验证、300 多页的 Go 入门宝典。

  • 图书勘误与配套代码:https://github.com/bigwhite/goprimer

小结:愿我们永远奔跑

最后,再次向每一位奔跑在二进制世界里的同行者致敬。

愿你的代码永远优雅,愿你的编译永远通过,愿你的创造力永不枯竭,愿你的 err 永远为 nil。

1024,程序员节快乐!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats