标签 RussCox 下的文章

Go 标准库将迎来 Zstandard:性能超越 Gzip,让你的应用更快、更省

本文永久链接 – https://tonybai.com/2025/11/08/proposal-zstd

大家好,我是Tony Bai。

在 Go 的世界里,一项被社区翘首以盼的提案在沉寂一年后,终于迎来了决定性的进展。2024 年,将 Zstandard 压缩算法纳入标准库的提案(#62513)被正式 Accept,但在那之后便鲜有动静。直到最近的 Go 编译器与运行时会议纪要中透露,这项工作将由社区的明星开发者 Klaus Post 主导推进。

这意味着,在未来的 Go 版本中,开发者将能开箱即用地获得一个官方维护、安全可靠且性能卓越的压缩工具。这不仅是对 Go 生态的一次重要补强,更将直接为无数 Go 应用带来性能提升、带宽节约和成本削减,真正实现“更快、更省”的承诺。

同时,这个提案背后曲折的历程——从激烈的技术选型辩论,到精雕细琢的 API 设计,再到因核心团队资源紧张而搁置,最终由社区力量重新激活——本身就是一幅展现 Go 生态演进的生动图景。

在本文中,我们将探讨 Zstandard 脱颖而出的技术优势,剖析其在工业界的成功案例,并揭示 compress/zstd 标准库从提案、API 设计到最终由社区力量重启的完整历程。

Zstandard:为何是它,而非其他?

在决定为标准库引入新的压缩算法时,Go 团队面临着众多选择。提案发起者 dsnet 在讨论中进行了一次精彩的“选美”,清晰地阐述了为何 Zstandard (Zstd) 能够脱颖而出:

  • Zstandard (Zstd): 由 Facebook (现 Meta) 开发并开源,拥有极佳的压缩/解压速度和出色的压缩比。更重要的是,它有正式的 RFC 规范(RFC 8878),这对于标准库实现的“正确性”至关重要。
  • Brotli: 同样优秀,但在设计上更偏向 Web 静态内容,且其庞大的静态字典(约 120KiB)与 Go 追求小体积静态二进制文件的哲学相悖。
  • XZ (LZMA): 拥有极高的压缩比,但代价是极其缓慢的压缩和解压速度,不适合通用场景。且缺乏正式的、明确的规范。
  • Snappy / LZ4: 追求极致的速度,但在压缩比上做出了巨大牺牲,应用场景相对小众。

Zstd 巧妙地结合了 LZ77 算法和一种名为 ANS (Asymmetric Numeral Systems) 的现代熵编码技术,在性能、压缩比和资源消耗之间取得了近乎完美的平衡,使其成为替代 Gzip 的“天选之子”。

注:截至Go 1.25.3版本,Go compress目录下提供了多种压缩算法的实现:bzip2实现了Burrows-Wheeler变换及霍夫曼编码;flate提供了DEFLATE算法核心,结合了LZ77和霍夫曼编码;gzip和zlib则分别将DEFLATE算法封装为gzip文件格式和zlib数据流格式;lzw实现了Lempel-Ziv-Welch算法。这些包共同为Go语言提供了多样化的数据压缩与解压缩能力。

注:Zstandard最新RFC规范为RFC 9659

工业界验证:Discord 与 Cloudflare 的性能飞跃

理论上的优势必须经过实践的检验。Zstd 在工业界的应用早已硕果累累。

  • **Discord 的 40% 带宽削减:** 通讯巨头 Discord 在将其实时网关的压缩算法从 zlib (Gzip) 迁移到流式 Zstandard 后,获得了惊人的收益。对于核心的 MESSAGE_CREATE 事件,压缩时间缩短了一半以上,负载体积也显著减小。这直接转化为更低的服务端 CPU 占用和客户端带宽节省,最终实现了 整体 Websocket 流量降低 40% 的壮举。

  • **Cloudflare 的容器镜像加速:** 在其全球容器平台上,Cloudflare 需要快速分发巨大的 AI 模型镜像(常超过 15GB)。通过将镜像层压缩算法从 Gzip 更换为 Zstd,一个 30GB 镜像的拉取时间从 8 分钟骤降至 4 分钟,速度翻倍,极大地提升了全球调度的灵活性和响应速度。

这些案例雄辩地证明,Zstd 是为现代高吞吐量、低延迟应用而生的。

API 设计的艺术:一场关于简洁、安全与未来的辩论

将新包引入标准库,API 的设计是重中之重。#62513 的讨论串完整记录了 compress/zstd API 从雏形到最终形态的演进过程。

核心原则:安全与一致性

提案伊始,就确立了两大基石:

  1. 安全优先: 标准库实现必须是纯 Go版本,不使用 unsafe 或汇编。dsnet 强调:“Go 社区调查一致显示,安全性比性能更重要。” 这意味着标准库版本追求的是可审查性、可维护性和跨平台的一致性,而非极致的性能。
  2. API 一致性: 新 API 应与 compress/gzip、compress/flate 等现有包保持风格统一,降低开发者的学习和迁移成本。

社区的声音:Klaus Post 的关键输入

在讨论中,github.com/klauspost/compress 系列库的作者 Klaus Post 扮演了关键角色。他的库是 Go 社区公认的最高性能压缩实现,其丰富的实战经验为标准库的设计提供了宝贵视角。

Klaus 指出,他自己的库 API 相对复杂,是因为支持多线程、异步等高级特性。他赞同标准库应剥离这些复杂性,提供一个完全同步的、线程安全的 API。同时,他也对字典(Dictionary)功能的 API 设计提出了深刻见解,强调了字典预处理的开销问题,这直接影响了后续 API 的设计。

最终定稿的 API

经过多轮讨论,由 Russ Cox (rsc) 总结并最终被接受的 API 形态如下(并非最终版):

package zstd

const (
    NoCompression      = 0
    BestSpeed          = 1
    BestCompression    = 9
    DefaultCompression = -1
)

type Dict struct { /* ... */ }
func ParseDict(enc []byte) (*Dict, error)
// ... 可能还包含 Marshal/Unmarshal 方法

type Reader struct { /* ... unexported fields ... */ }
func NewReader(r io.Reader) (*Reader, error)
func (z *Reader) Reset(r io.Reader) error
func (z *Reader) AddDict(*Dict)
func (z *Reader) SetRawDict([]byte)
func (z *Reader) Read(p []byte) (int, error)
func (z *Reader) Close() error

type Writer struct { /* ... unexported fields ... */ }
func NewWriter(w io.Writer) *Writer
func (z *Writer) Reset(w io.Writer)
func (z *Writer) SetLevel(int) error
func (z *Writer) AddDict(*Dict)
func (z *Writer) SetRawDict([]byte)
func (z *Writer) Write([]byte) (int, error)
func (z *Writer) Flush() error
func (z *Writer) Close() error

这个设计体现了 Go 标准库的哲学:

  • Setter 模式: 采用 SetLevel、AddDict 等方法进行配置,而不是更复杂的构造函数重载或函数式选项,兼顾了灵活性和简洁性。
  • 独立的 Dict 类型: 将字典抽象为 Dict 类型,通过 ParseDict 进行预处理。这解决了 Klaus 提出的“重复解析字典开销大”的问题,允许用户一次解析,多次复用。
  • 错误处理: 关键配置(如 SetLevel、ParseDict)返回 error,增强了 API 的健壮性。

漫长的等待与社区英雄的登场

提案于 2024 年被接受,为何直到 2025 年底才真正启动?这背后反映了 Go 核心团队面临的现实挑战。Go 团队规模精简,核心成员的精力需要分配给语言、编译器、运行时等更高优先级的任务。提案发起者 dsnet 也深度参与了 json/v2 等重大项目,无暇分身。

在此期间,Klaus Post 主动请缨,表示愿意贡献一个精简版的、符合标准库要求的实现。然而,这个提议在当时并未得到明确的推进信号。

转机出现在 2025 年 11 月的 Go 团队内部会议。纪要显示,团队终于有带宽来审查社区对 compress/flate 和 compress/zstd 的贡献。会议明确提到:“很高兴有社区审查。我们能去问问 k8s 的人吗?”(意指寻求更多社区的反馈和测试)。这标志着官方正式为 Klaus Post 的贡献打开了大门。随后Klaus Post也给出了自己的贡献时间表,大约在2026年Q1提交第一版实现给Go团队审查。

小结:一次迟到但意义非凡的升级

compress/zstd 的加入,对 Go 生态而言,是一次迟到但意义非凡的升级。它不仅仅是增加了一个功能包,更是一次:

  • 技术的现代化: 用一个在性能和效率上全面超越 Gzip 的现代算法,武装 Go 的标准库。
  • 生态的成熟: 将社区经过千锤百炼的最佳实践,以安全、稳健的方式融入官方标准。
  • 模式的探索: 展示了在核心团队资源有限的情况下,如何通过与社区领袖的协作,共同推动语言生态向前发展。

对于广大 Go 开发者来说,未来已来。不久之后(或许在 Go 1.27),我们将能以最简单、最 Go-like 的方式,为我们的应用插上 Zstandard 的翅膀,轻松实现性能提升与成本节约。这无疑是 Go 社区协作精神的又一次伟大胜利。

参考资料

  • https://github.com/golang/go/issues/62513
  • https://blog.cloudflare.com/container-platform-preview
  • https://discord.com/blog/how-discord-reduced-websocket-traffic-by-40-percent
  • https://www.rfc-editor.org/rfc/rfc8878

你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


想系统学习Go,构建扎实的知识体系?

我的新书《Go语言第一课》是你的首选。源自2.4万人好评的极客时间专栏,内容全面升级,同步至Go 1.24。首发期有专属五折优惠,不到40元即可入手,扫码即可拥有这本300页的Go语言入门宝典,即刻开启你的Go语言高效学习之旅!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

Go 零拷贝“最后一公里”:Peek API背后的设计哲学与权衡

本文永久链接 – https://tonybai.com/2025/10/10/proposal-add-buffer-peek

大家好,我是Tony Bai。

在 Go 的世界里,io.Reader 是一个神圣的接口。它如同一条设计精良、四通八达的高速公路,为数据流的传输提供了统一、优雅的抽象。然而,在这条高速公路的尽头,当数据流的目的地就在眼前——一块已然存在的内存([]byte)时,我们却常常被迫驶下一条颠簸、缓慢的“土路”,进行一次本可避免的内存拷贝。

这个从 []byte 到 io.Reader 再回到 []byte 的性能损耗,正是 Go io 体系中长期存在的“最后一公里”问题。

近期,一个看似微小却意义深远的提案(#73794: bytes: add Buffer.Peek)被社区纳入提案委员会的考察范围(Active),它标志着 Go 团队为铺平这条“最后一公里”迈出了务实而关键的一步。这背后,是一场长达数年、关于性能、抽象与设计哲学的深度思辨。

“最后一公里”的痛点:当 io.Reader 遭遇 []byte

问题的根源,正如开发者 Ted Unangst 在其广为流传的文章《Too Much Go Misdirection》中所抱怨的那样:

“我手里明明已经有了一份完整的 []byte 数据,但许多标准库函数(如 image.Decode)却只接受一个 io.Reader 接口。为了满足这个接口,我不得不将 []byte 包装成一个 bytes.Reader。结果,本应可以零拷贝完成的操作,却因为这层“中间商”,被迫进行了一次代价高昂的内存拷贝。”

image.Decode 的工作机制完美地暴露了这个问题:为了确定图片格式,它需要“窥探”(peek) 数据流的头部几个字节。如果传入的 io.Reader 没有 Peek 方法,image.Decode 就会用 bufio.NewReader 将其包裹起来,这个过程必然涉及数据的拷贝

不幸的是,bytes.Reader 和 bytes.Buffer 这两个最常用的、基于内存的 io.Reader 实现,长期以来都缺少一个 Peek 方法。这使得无数 Gopher 的“零拷贝之梦”在这“最后一公里”上戛然而止,甚至催生了使用 unsafe 包来“强行”获取底层字节切片的黑魔法,只为绕开这层不必要的抽象。

科普角:io 体系中的“窥探”艺术

在深入探讨提案之前,让我们先厘清几个核心的 io 操作概念,它们是铺平“最后一公里”所需的关键工具:

  • Read(p []byte): 这是 io.Reader 的核心。它从数据源读取数据并填充到调用者提供的 p 切片中,同时消耗掉源头的数据。
  • Peek(n int): “窥探”。它返回接下来的 n 个字节,但不消耗它们。下一次 Read 操作依然能读到这些字节。这对于需要根据数据头部信息来决定下一步操作的解析器(如 image.Decode)至关重要。
  • Discard(n int): “丢弃”。它直接消耗掉接下来的 n 个字节,但不把它们复制到任何地方。这通常与 Peek 配合使用:先 Peek 数据进行分析,然后 Discard 掉已经分析过的部分。

Peek + Discard 的组合,是实现高性能、零拷贝流式处理的关键。

第一次尝试:宏大的 io.ReadPeeker 接口(#63548)

社区为铺平“最后一公里”的第一次尝试是宏大的、雄心勃勃的。提案 #63548 建议在 io 包中定义一个全新的标准接口:

type ReadPeeker interface {
    io.Reader
    Peek(n int) ([]byte, error)
}

其目标是为所有支持“窥探”的 io.Reader 提供一个统一的、可供类型断言的契约,从而在标准库层面建立起“零拷贝读取”的通用范式。

然而,这个看似完美的“高速公路”方案,却在深入讨论中陷入了泥潭。Go 核心团队,包括 Russ Cox (rsc),提出了一系列极其棘手的现实问题:

  • 缓冲区的模糊性:Peek(n) 时,如果内部缓冲区不足 n 字节,应该怎么做?是返回一个短读取,还是尝试从底层 Reader 读取更多数据?
  • 错误的定义:如果 n 太大,超出了缓冲区的最大容量,应该返回什么错误?ErrBufferFull 的定义和行为该如何统一?Russ Cox 尖锐地指出:“如果一个实现只能 Peek 2 个字节,但你需要 1536 个字节,会发生什么?这似乎让客户端代码总是需要包裹一层 fallback 逻辑,非常笨拙。”
  • API 的完备性:是否还需要一个 Buffered() 方法来告知调用者可以安全 Peek 的最大字节数?但 bufio.Reader 的 Buffered() 并非 Peek 的上限,这又引入了新的不一致。

由于无法就这些细节达成一个足够简单、清晰且无歧义的共识,rsc 最终以“这感觉还没有找到正确的路径”(This all seems not quite there yet) 为由,最终将这个宏大的提案标记为[decline]。这次“失败”深刻地揭示了 Go 团队的设计原则:宁缺毋滥。一个不够完美的标准接口,比没有这个接口更糟糕。

第二次尝试:务实的 bytes.Buffer.Peek(#73794)

在宏大的方案搁浅后,社区回归了更务实的思考。提案 #73794 不再追求修建一条完美的“超级高速公路”,而是聚焦于修复那条最常用、最拥堵的“最后一公里”路段:让 bytes.Buffer 支持 Peek

// 提案的核心:为 bytes.Buffer 增加一个 Peek 方法
func (b *Buffer) Peek(n int) ([]byte, error)

这个提案的讨论过程要顺利得多,但也并非没有争议。其中最核心的权衡和63548提案其实是一样的,都聚焦于安全性与一致性

  • 反对者的声音:bytes.Reader 的一个隐性优点是其内容的“事实不可变性”。一旦为其添加 Peek,就会暴露其底层 []byte,一个“淘气的用户”可能会修改这个切片,从而破坏 Reader 的状态。这不仅带来了安全隐患,也使得 bytes.Reader 与完全不可变的 strings.Reader 在 API 设计上出现了不对称。
  • 支持者的反驳:社区很快指出,这种“事实不可变性”早已被打破。通过 bytes.Reader.WriteTo 方法和一个特制的 io.Writer,已经可以在不使用 unsafe 的情况下获取并修改其底层切片。因此,增加 Peek 并非引入新的风险,只是将一个隐晦的“后门”变成了一个明确的、有用的 API。

最终,务实主义战胜了理论上的纯粹性。Go 团队认为,为这个极其常见的用例提供便利,其收益远大于它所带来的、本就存在的微小风险。这个小而美的提案最终得到了提案委员会的青睐。

小结:对我们日常开发者的启示

bytes.Buffer.Peek 的诞生故事,是理解 Go 语言设计哲学的一面绝佳棱镜。它告诉我们,Go 的世界里,优雅的抽象是准则,但务实的性能是现实。对于我们日常的 API 设计而言,这个故事同样富有启发:

  1. 考虑提供双重 API:在针对“too much go misdirection”一文的Hacker News 的讨论中,一个被反复提及的观点是,一个好的 API 应该同时接受 []byte 和 io.Reader。标准库的 encoding/json 就是这样做的。这允许用户在拥有完整数据时选择最高效的路径,在处理流数据时选择最具弹性的路径。

  2. 编写“窥探感知”的函数:当你设计的函数接受 io.Reader 时,可以借鉴 image.Decode 的模式:首先通过类型断言检查传入的 Reader 是否已经实现了 Peeker 接口。如果是,就直接使用其高性能的 Peek 方法;如果不是,再用 bufio.NewReader 将其包裹起来作为 fallback。

  3. 理解“特殊优待”是 Go 的一部分:Go 标准库充满了对特定类型(如 *bytes.Buffer, *bytes.Reader, *strings.Reader)的“特殊优待”。例如,http.Client 在处理请求体时,会检查 body 是否是这几种类型,以便获取 Content-Length 或实现请求重试。这并非设计缺陷,而是 Go 在通用性与现实世界性能需求之间取得平衡的务实之道。

后续如果bytes.Buffer.Peek 成功加入标准库,虽然只是标准库中一个微小的改动,但它成功地铺平了 Go io 体系中最常见的一段“最后一公里”。

参考资料

  • https://github.com/golang/go/issues/73794
  • https://news.ycombinator.com/item?id=44031009#44036152
  • https://flak.tedunangst.com/post/too-much-go-misdirection
  • https://github.com/golang/go/issues/63548

你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!

这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats