泛型 - Tony Bai

标签泛型下的文章

Go的简洁性之辩：轻量级匿名函数提案为何七年悬而未决？

六月 3, 2025
0 条评论

本文永久链接 – https://tonybai.com/2025/06/03/lightweight-anonymous-func-syntax

大家好，我是Tony Bai。

自2017年提出以来，Go语言关于引入轻量级匿名函数语法的提案（Issue #21498）一直是社区讨论的焦点。该提案旨在提供一种更简洁的方式来定义匿名函数，尤其是当函数类型可以从上下文推断时，从而减少样板代码，提升代码的可读性和编写效率。然而，历经七年多的广泛讨论、多种语法方案的提出与激辩，以及来自核心团队成员的实验与分析，截至 2025年5 月底，官方对该提案的最新立场是“可能被拒绝 (likely declined)”，尽管问题仍保持开放以供未来考虑。近期该issue又冲上Go issue热度榜，让我有了对该提案做一个简单解读的冲动。在本文中，我将和大家一起探讨该提案的核心动机、社区的主要观点与分歧、面临的挑战，以及这一最新倾向对 Go 语言和开发者的潜在影响。

冗余之痛：当前匿名函数的困境

在Go中，匿名函数的标准写法是

func(参数列表) (返回类型列表) {
    函数体
}

虽然这种语法明确且一致，但在许多场景下，尤其是作为回调函数或在函数式编程风格（如配合泛型和迭代器使用）中，参数和返回类型往往可以从上下文清晰推断，此时显式声明则显得冗余。

提案发起者 Neil (neild) 给出了一个经典的例子：

func compute(fn func(float64, float64) float64) float64 {
    return fn(3, 4)
}

// 当前写法，类型声明重复
var _ = compute(func(a, b float64) float64 { return a + b })

许多现代语言，如 Scala ((x, y) => x + y 或 _ + _) 和 Rust (|x, y| { x + y })，都提供了更简洁的 lambda 表达式语法，允许在类型可推断时省略它们。这种简洁性被认为可以提高代码的信噪比，让开发者更专注于业务逻辑。

Go匿名函数常见的痛点场景包括：

回调函数：如 http.HandlerFunc、errgroup.Group.Go、strings.TrimFunc。
泛型辅助函数：随着 Go 1.18 泛型的引入，如 slices.SortFunc、maps.DeleteFunc 以及设想中的 Map/Filter/Reduce 等操作，匿名函数的应用更加广泛，其冗余性也更为凸显。
迭代器：Go 1.23 引入的 range over func 迭代器特性，也使得将函数作为序列或转换器传递成为常态，轻量级匿名函数能显著改善其体验（如 #61898 x/exp/xiter 提案的讨论中多次提及）。正如一些开发者指出的，结合迭代器使用时，现有匿名函数语法会使代码显得冗长。

提案核心：轻量级语法的设想

该提案的核心思想是引入一种“非类型化函数字面量 (untyped function literal)”，其类型可以从赋值上下文（如变量赋值、函数参数传递）中推断得出。提案初期并未限定具体语法，而是鼓励社区探讨各种可能性。

Go team的AI 生成的总结指出，讨论中浮现的语法思路主要可以归为以下几种：

箭头函数风格 (Arrow Function Style): 借鉴 JavaScript, Scala, C#, Java 等。
- 例如：(x, y) => { x + y } 或 (x,y) => x+y
保留 func 关键字并进行变体:
- 例如：func a, b { a+b } (省略参数括号)
- func(a,b): a+b (使用冒号分隔)
- func { x, y | return x < y } (参数列表移入花括号，使用 | 或 -> 分隔)
基于现有语法的类型推断改进:
- 例如：允许在 func(a _, b _) _ { return a + b } 中使用 _ 作为类型占位符。

其核心优势在于：

减少样板代码： 省略冗余的类型声明。
提升可读性（对部分人而言）： 使代码更紧凑，逻辑更突出。
促进函数式编程风格： 降低使用高阶函数和回调的心理门槛。

社区的激辩：争议焦点与权衡

该提案引发了 Go 社区长达数年的激烈讨论，根据 Robert Griesemer 提供的 AI上述总结和整个讨论链，主要争议点包括：

1. 可读性 vs. 简洁性

支持简洁方： 认为在类型明确的上下文中，重复声明类型是视觉噪音。简洁的语法能让代码更易于速读和理解，尤其是在函数式链式调用中。他们认为 Go 已经通过 := 接受了类型推断带来的简洁性。
强调显式方： 以 Dave Cheney 的名言“Clear is better than clever” 为代表，一些开发者认为显式类型声明增强了代码的自文档性和可维护性。他们担心过度省略类型信息会增加认知负担，尤其对于初学者或在没有强大 IDE 支持的情况下阅读代码。Go密码学前负责人FiloSottile 指出，在阅读不熟悉的代码时，缺少类型信息会迫使其跳转到定义或依赖 IDE。Go元老Ian Lance Taylor也表达了对当前显式语法的肯定，认为其对读者而言清晰度很高。

2. 语法选择的困境

这是提案迟迟未能落地的最主要原因之一。社区提出了数十种不同的语法变体，但均未能形成压倒性的共识。

箭头语法 (=> 或 ->)：

优点： 许多开发者因在其他语言中的使用经验而感到熟悉，被认为非常简洁。Jimmy Frasche 的语言调查显示这是许多现代语言的选择。
缺点： 一些人认为它“不像 Go”，=> 可能与 >= 或 <= 在视觉上产生混淆，-> 可能与通道操作 <- 混淆。Robert Griesemer指出，虽然 (x, y) => x + y 感觉自然，但 (x, y) => { … } 对于 Go 而言感觉奇怪。Ian Lance Taylor也表达了对箭头符号的不完全满意，认为在某些代码上下文中可读性欠佳。

保留 func 并简化：

func params {} (省略参数括号)：Ian Lance Taylor 和 Robert Griesemer 曾探讨过此形式。主要问题在于 func a, b {} 在函数调用参数列表中可能与多个参数混淆。
func { params | body } 或 func { params -> body }：Griesemer 在后期倾向于这种将参数列表置于花括号内的形式，认为 func { 可以明确指示轻量级函数字面量。| 用于语句体，-> (可选地) 用于单表达式体。Jimmy Frasche 对此形式的“DSL感”提出异议，认为其借鉴的 Smalltalk/Ruby 风格在 Go 中缺乏相应的上下文。

其他符号：

如使用冒号 func(a,b): expr ，或 _ 作为类型占位符。Griesemer认为 _ 作为类型占位符会产生混淆。

Robert Griesemer 进行的实验表明，func 后不带括号的参数列表 (func x, y { … }) 在实际 Go 代码中看起来奇怪，而箭头符号 (=>) 则“出乎意料地可读”。他后期的实验进一步对比了 (args) => { … } 和 func { args | … }。

3. 隐式返回 (Implicit Return)

对于单表达式函数体是否应该省略 return 关键字，也存在分歧。

支持方： 认为这能进一步提升简洁性，是许多 lambda 语法的常见特性。
反对方： 担心这会使返回行为不够明确，尤其是在 Go 允许多值返回和 ExpressionStmt (如函数调用本身可作为语句) 的情况下，可能会导致混淆或意外行为。例如 func { s -> fmt.Println(s) }，如果 fmt.Println 有返回值，这个函数是返回了那些值，还是一个 void 函数？这需要非常明确的规则，并且可能依赖上下文。

4. 类型推断的复杂性与边界

虽然核心思想是“从上下文复制类型”，但当涉及到泛型时，推断会变得复杂。

Map((x) => { … }, []int{1,2,3}) ：如果 Map 是 func Map[Tin, Tout any](in []Tin, f func(Tin) Tout) []Tout，那么 Tout 如何推断？是要求显式实例化 Map[int, ReturnType]，还是尝试从 lambda 体内推断？后者将引入更复杂的双向类型推断，可能导致参数顺序影响推断结果，或在接口类型和具体类型之间产生微妙的 bug（如 typed nil 问题）。
neild 和 Merovius 指出，在很多情况下，可能需要显式提供泛型类型参数，或者接受推断的局限性。Griesemer提出的最新简化方案 (params) { statements } 明确指出其类型是从目标函数类型“复制”而来，且目标类型不能有未解析的类型参数。

5. 对 Go 语言哲学的影响

一些开发者担忧，引入过于灵活或“魔法”的语法会偏离 Go 语言简单、直接、显式优于隐式的核心哲学。他们认为现有语法虽冗长，但足够清晰，且 IDE 工具（如 gopls 的自动补全）已在一定程度上缓解了编写时的痛点。

开发者tmaxmax在其详尽的实验分析中指出，尽管标准库中单表达式函数字面量比例不高，但在其工作代码库中，这类情况更为常见，尤其是在使用泛型辅助函数如 Map、Filter 时。这表明不同代码库和使用场景下，对简洁语法的需求度可能存在差异。

最新动向：为何“可能被拒绝”？

在提案的最新comment说明中 (May 2025)，明确指出：

The Go team has decided to not proceed with adding a lightweight anonymous function syntax at this time. The complexity cost associated with the new syntax, combined with the lack of clear consensus on the syntax, makes it difficult to justify moving forward. Therefore, this proposal is likely declined for now. The issue will remain open for future consideration, but the Go team does not intend to pursue this proposal for now.

这一立场由 Robert Griesemer 在上述AI 总结中进一步确认。核心原因可以归纳为：

缺乏明确共识： 尽管讨论热烈，但社区和核心团队均未就一个理想的、被广泛接受的语法方案达成一致。各种方案都有其支持者和反对者，以及各自的优缺点和潜在问题。
复杂性成本： 任何新语法都会增加语言的复杂性（学习、实现、工具链维护、文档等）。在收益不明确或争议较大的情况下，Go 团队倾向于保守。
潜在的微妙问题与可读性担忧： 正如讨论中浮现的各种边界情况（如类型推断与泛型的交互、隐式返回的歧义、私有类型访问限制等），引入新语法需要非常谨慎。Ian Lance Taylor 明确表达了对当前显式语法在可读性方面的肯定，并对省略类型信息可能带来的阅读障碍表示担忧。
已有工具的缓解作用： 正如一些评论者指出，IDE 的自动补全功能在一定程度上减轻了编写冗长函数字面量的痛苦。

Robert Griesemer进一步总结，将备选方案缩小到 (params) { statements }, (params) { statements }, 和 (params) -> { statements } (或 =>)，并指出即使是这些方案，也各有其不完美之处。他强调了在没有明确压倒性优势方案和社区强烈共识的情况下，贸然推进的风险。

影响与未来展望

尽管 #21498 提案目前大概率会被搁置，但它所反映的开发者对于减少样板代码、提升特定场景下编码效率的诉求是真实存在的。

对迭代器和泛型库的影响： 如果提案最终未被采纳，那么严重依赖回调函数的泛型库（如设想中的 xiter 或其他函数式集合库）在使用上将保持当前的冗余度。这可能会在一定程度上抑制纯函数式风格在 Go 中的发展，或者促使开发者寻求其他模式（例如，手写循环或构建更专门的辅助函数）。有开发者认为缺乏简洁的 lambda 语法是阻碍 Go 社区充分实验函数式特性（尤其是迭代器组合）的先决条件之一。
社区的持续探索： 提案的开放状态意味着未来仍有讨论空间。如果 Go 语言在其他方面（如类型系统、元编程能力）发生演进，或者社区就某一特定语法方向形成更强共识，提案可能会被重新激活。tmaxmax 建议将讨论重心从无休止的语法细节转向更根本的动机和语义问题。
工具的进步： IDE 和代码生成工具可能会继续发展，以进一步缓解手动编写完整函数字面量的繁琐。
开发者习惯： Go 开发者将继续在现有语法框架内寻求平衡。对于高度重复的匿名函数模式，可能会更多地采用具名辅助函数或方法来封装。正如 adonovan 的实验所示，某些特定场景（如单 return 语句）可能更容易找到局部优化方案。

小结

Go 语言轻量级匿名函数语法的提案 #21498，是一场关于语言简洁性、可读性、一致性与演进方向的深刻大讨论。它暴露出在追求更现代编程范式便利性的同时，维护 Go 语言核心设计哲学的内在张力。虽然目前看来，由于缺乏明确共识和对复杂性的审慎态度，引入一种全新的、被广泛接受的简洁匿名函数语法道阻且长，但这场长达七年的讨论本身，已经为 Go 社区积累了宝贵的思考、实验数据和经验。未来，无论此提案走向何方，对代码清晰度和开发者体验的追求都将持续驱动 Go 语言的演进。Go 团队将持续观察语言的使用和社区的需求，在合适的时机可能会重新审视此类提案。

在 Go 语言的演进过程中，每一个提案的讨论都凝聚了社区的智慧和对这门语言深沉的热爱。轻量级匿名函数语法的提案，历经七年风雨，虽然目前官方倾向于搁置，但这扇门并未完全关闭。

对于 Go 开发者来说，这场旷日持久的讨论留下了哪些值得我们深思的问题？

你认为在当前 Go 的语法体系下，匿名函数的冗余是亟待解决的痛点吗？或者你认为现有的显式声明更符合 Go 的哲学？
在可读性、简洁性和语言复杂性之间，你认为 Go 应该如何权衡？
如果未来 Go 语言采纳某种形式的轻量级匿名函数，你最期待哪种语法特性（例如，类型推断、隐式返回、特定符号）？
你是否在自己的项目中因为匿名函数的冗余而选择过其他编码模式？欢迎分享你的经验和看法。

我期待在评论区看到你的真知灼见，共同探讨 Go 语言的现在与未来！

img{512x368}

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求，请扫描下方公众号二维码，与我私信联系。

原子操作的瓶颈与Go的多核扩展性之痛：深入剖析sync.ShardedValue及per-CPU提案

五月 19, 2025
0 条评论

本文永久链接 – https://tonybai.com/2025/05/19/shardedvalue-per-cpu-proposal

大家好，我是Tony Bai。

在追求极致性能的道路上，Go 语言凭借其简洁的并发模型和高效的调度器，赢得了众多开发者的青睐。然而，随着现代服务器 CPU核心数量的不断攀升，一些我们曾经习以为常的“快速”操作，在高并发、多核环境下，也逐渐显露出其性能瓶颈。其中，原子操作 (atomic operations) 的扩展性问题，以及标准库中一些依赖原子操作的并发原语（如 sync.RWMutex）的性能表现，成为了社区热议的焦点。

最近，fasthttp 的作者及 VictoriaMetrics 数据库的联合创始人 Aliaksandr Valiakin (valyala) 在 X.com 上的一番“叹息”，更是将原子计数器的扩展性问题推向了前台：

Valyala 指出：“基于原子操作的计数器更新性能在多 CPU 核心上无法扩展，因为每个 CPU 核心在增量操作期间都需要从慢速内存中原子加载实际的计数器值。因此，实际性能受限于内存延迟（约 15ns，即每秒 6 千万次增量）。通过使用可缓存于 CPU L1 缓存的 per-CPU 计数器，可以将单 CPU 核心性能提升至每秒数十亿次增量。遗憾的是，Go 语言本身并未提供高效处理 per-CPU 数据的函数。”

这番话点出了一个残酷的现实：即使是看似轻量级的原子操作，在多核“混战”中也可能成为性能的阿喀琉斯之踵。那么，这背后的深层原因是什么？Go 社区又在如何探索解决之道呢？今天，我们就来深入剖析这个问题，并解读 Go 项目 issue 中几个重要的相关提案，同时看看社区是如何先行一步尝试解决这类问题的。

原子操作为何在高并发多核下“失速”？sync.RWMutex 的痛点

要理解原子操作的瓶颈，我们需要潜入到 CPU 缓存的微观世界。现代多核 CPU 为了加速内存访问，都配备了多级缓存（L1, L2, L3）。当多个核心同时读写同一块内存区域时，就需要缓存一致性协议 (Cache Coherence Protocols)（如 MESI，Modify-Exclusive-Shared-Invalid）来确保数据的一致性。

当我们对一个共享变量（即使是原子变量）进行写操作时，例如 atomic.AddInt64，会发生什么？

执行该操作的 CPU 核心需要获得对该变量所在缓存行 (Cache Line) 的独占访问权 (Exclusive state)。
如果其他核心的缓存中也存在这份缓存行的副本（即使是共享状态 Shared state），它们会被标记为无效 (Invalidate)。
当其他核心再次需要访问这个变量时，就会发生缓存未命中 (Cache Miss)，需要从更高级别的缓存或主内存中重新加载数据，并可能再次引发缓存行在不同核心间的同步。

在高并发场景下，如果多个核心频繁地对同一个缓存行中的原子变量进行写操作，就会导致：

缓存行在不同核心的 L1/L2 缓存之间频繁失效和同步，这个过程被称为“缓存行乒乓 (Cache Line Ping-Ponging)”。
产生大量的总线流量和内存访问延迟。

这就是所谓的真共享 (True Sharing) 争用。即使原子操作本身在单个核心上执行得非常快，这种跨核心的缓存同步开销也会让其整体性能急剧下降。

这个问题的典型体现之一，便是 Go 标准库中的 sync.RWMutex。正如 github.com/jonhoo/drwmutex 项目在其 README 中指出的：“Go 默认的 sync.RWMutex 在多核下扩展性不佳，因为所有读操作者在尝试原子性地增加同一个内存位置（用于读者计数）时会产生争用。” 对于读多写少的场景，本应高效的读锁操作，却因为内部共享计数器的原子更新而受到了性能限制。

社区的先行者：jonhoo/drwmutex 的分片读写锁实践

面对标准库 sync.RWMutex 在多核环境下的扩展性瓶颈，社区早已开始了积极的探索。一个显著的例子便是 jonhoo/drwmutex，一个 n 路分片读写锁（Distributed Read-Write Mutex）的实现，也被称为“大读者”锁。

其核心思想非常直观：为每个 CPU 核心提供其自己的 RWMutex 实例。读者只需要获取其核心本地的读锁，而写者则必须按顺序获取所有核心上的锁。 这种设计通过将读操作的争用分散到各个核心，从而显著提升了读多写少场景下的并发性能。

jonhoo/drwmutex 的实现也揭示了构建这类 per-CPU 优化方案的一些关键技术点和挑战：

获取当前 CPU ID： 为了将操作路由到正确的本地锁，需要一种方法来确定当前 goroutine 正在哪个 CPU 核心上运行。drwmutex 在 Linux x86 平台上使用了 CPUID 汇编指令来获取 APICID，并在程序启动时构建 APICID 到 CPU 索引的映射。这突显了获取可靠且高效的 CPU/P 标识是实现此类优化的一个难点。
CPU 信息可能过时： README 中也坦诚地指出，goroutine 获取到的 CPU 信息可能是过时的（因为 goroutine 可能已被调度到其他核心），但这主要影响性能而非正确性（只要读者记住它获取的是哪个锁）。OS 内核通常会尽量将线程保持在同一核心以提高缓存命中率，这在一定程度上缓解了这个问题。
性能表现与 NUMA 效应： jonhoo/drwmutex 的性能测试表明，在核心数较多，特别是写操作比例低于 1% 时，其性能远超 sync.RWMutex。有趣的是，其性能图表还揭示了 NUMA (Non-Uniform Memory Access) 效应的影响——在测试机器上每增加一个包含 10 个核心的 NUMA 节点，跨核心流量的成本就会增加，导致性能曲线出现波动。

jonhoo/drwmutex 的实践不仅提供了一个解决 sync.RWMutex 性能问题的有效方案，也为后续 Go 官方和社区在 per-CPU 数据结构方面的探索提供了宝贵的经验和参照。

官方的早期探索：sync.ShardedValue 的初心与挑战 (#18802)

在社区积极探索的同时，Go 核心团队也早已关注到这类问题。一个重要的早期官方提案便是由 Austin Clements 在 2017 年提出的 sync.ShardedValue (issue #18802)。

sync.ShardedValue 的核心思想与 jonhoo/drwmutex 有异曲同工之妙：提供一种机制来创建和使用分片值，将一个逻辑上的共享值分散到多个独立的“分片”中，每个分片与一个 CPU 核心或更准确地说是 Go 调度器中的 P (Processor) 相关联。这样，每个 P 上的 goroutine 优先访问其本地分片，从而大大减少对单一共享内存位置的争用。

该提案围绕 Get()、Put() 和 Do() 等核心 API 进行了深入讨论，涉及了诸多设计维度，例如 Get/Put 的阻塞性、溢出处理、Do 操作的一致性等。尽管因难以就“最重要的问题达成共识”而被搁置，但 sync.ShardedValue 提案为后续的探索奠定了重要的基础，并清晰地指明了通过“分片”来提升多核扩展性的方向。

新的尝试：valyala 的 sync.PLocalCache (#69229) 与 sync.MLocal (#73667)

近期，valyala 基于其在 fasthttp 和 VictoriaMetrics 等高性能项目中的实践经验，提出了两个更聚焦、API 更简洁的提案，试图从特定场景切入，解决 per-CPU/per-P/per-M 数据的高效访问问题。

1. sync.PLocalCache (issue #69229): Per-P 对象缓存

设计目标： 为 CPU 密集型的算法提供一个高效且可随 CPU 核心数线性扩展的状态缓存机制。
API 设计： 核心是 Get() (返回 P 本地对象，若无则返回 nil) 和 Put() (将对象放回 P 本地存储)，保证 Get() 返回的对象只能被当前 goroutine 访问，无需额外同步。
解决痛点： 旨在解决 sync.Pool 在作为严格 per-P 缓存时存在的问题，如跨 P 窃取、内存浪费和 GC 清理等。

2. sync.MLocal[T any] (issue #73667): Per-M (OS 线程) 泛型存储

设计目标： 为需要在 OS 线程层面实现数据隔离以达到线性扩展性的并发代码，提供 M 本地存储。
API 设计 (泛型)： 提供 Get() (返回当前 M 的 *T 项) 和 All() (返回所有 M 上的项)。
解决痛点： 直接应对 valyala 在 VictoriaMetrics 中遇到的共享缓冲区互斥锁争用导致的扩展性瓶颈。

这些提案的共性、差异与启示

无论是社区的 jonhoo/drwmutex 实践，还是官方及 valyala 的提案，它们的核心目标都是一致的：通过数据的分片或本地化，最大限度地减少多核间的共享内存争用，从而提升高并发应用在多核处理器上的性能和可伸缩性。

然而，它们在具体实现、API 设计的通用性、易用性以及针对的场景上有所不同：

jonhoo/drwmutex 是一个针对特定问题（读写锁）的具体解决方案，它依赖平台相关的 CPUID 指令，并自己处理了核心映射和数据同步。
sync.ShardedValue 试图提供一个更通用的分片值抽象，但也因此面临更大的设计复杂性和社区共识挑战。Austin Clements 后续也反思了早期设计，并提出了更优的“检出/检入”模型。
sync.PLocalCache 和 sync.MLocal 则更为聚焦，API 更简洁，分别针对 per-P 缓存和 per-M 存储这两个具体场景。

这些探索过程也充满了 Go 社区对技术细节的极致追求和严谨思辨，例如关于命名（”sharding” vs “perCPU” vs “SplitValue”）、GOMAXPROCS 动态变化的影响、与 GC 的交互、API 语义的精确性（如 mknyszek 提出的包含 Merge 方法的 ShardedValue API 及其多种语义可能）以及泛型的应用等。

展望未来：Go 如何更好地拥抱多核时代？

原子操作的瓶颈、标准库并发原语的局限，以及社区和官方对 per-CPU/P/M 存储方案的持续探索，清晰地表明了 Go 语言在追求极致多核扩展性方面仍有提升空间。解决这类底层并发原语的性能问题，对于 Go 在高性能服务器、大规模分布式系统、数据库、监控系统等领域的持续领先至关重要。

未来，我们或许会看到：

更底层的运行时支持： Go 运行时可能会暴露更底层的、与调度器（P、M）相关的亲和性原语，或提供高效获取当前 P/核心 ID 的标准方法，正如 jonhoo/drwmutex 所尝试的那样。
标准库中出现新的同步原语： 借鉴这些提案和社区实践的精华，可能会有新的、经过精心设计的同步原语加入到 sync 或 sync/atomic 包中。
社区持续贡献优秀的解决方案： 像 jonhoo/drwmutex 这样的项目，即使官方没有立即提供标准方案，社区也会基于现有技术孵化出优秀的第三方库。

小结

从 valyala 对原子操作性能的“叹息”，到 jonhoo/drwmutex 的巧妙实践，再到 Go 社区围绕 sync.ShardedValue、sync.PLocalCache、sync.MLocal 等提案的深入探讨，我们看到了 Go 语言在追求极致性能道路上永不停歇的脚步。这不仅仅是关于几个新的 API，更是关于 Go 如何在多核时代继续保持其并发优势和工程效率的战略思考。

作为 Gopher，关注这些讨论和提案的进展，理解其背后的设计哲学和技术挑战，不仅能让我们更深刻地认识 Go 语言，也能启发我们在自己的高性能项目中进行类似的性能优化思考和实践。

让我们共同期待 Go 在多核扩展性方面能迈出更坚实的步伐，为构建更高性能的未来系统提供更强大的动力！

参考资料

Distributed Read-Write Mutex in Go – https://github.com/jonhoo/drwmutex
proposal: sync: support for sharded values #18802 – https://github.com/golang/go/issues/18802
proposal: sync: add M-local storage #73667 – https://github.com/golang/go/issues/73667
proposal: sync: add PLocalCache #69229 – https://github.com/golang/go/issues/69229

聊一聊，也帮个忙：

在你的 Go 项目中，是否也曾遇到过原子操作或 sync.RWMutex 在高并发多核下的性能瓶颈？你是如何解决的？是否尝试过类似 jonhoo/drwmutex 的分片锁方案？
对于 Go 社区提出的这些 per-CPU/P/M 存储提案，你认为哪种设计思路更具潜力？或者你有什么更好的建议？
你认为 Go 语言在提升多核扩展性方面，未来最应该关注哪些方向？

欢迎在评论区留下你的经验、思考和问题。如果你觉得这篇文章对你有所启发，也请转发给你身边的 Gopher 朋友们，让更多人参与到这场关于 Go 性能未来的讨论中来！

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求，请扫描下方公众号二维码，与我私信联系。

标签泛型下的文章

Go的简洁性之辩：轻量级匿名函数提案为何七年悬而未决？

冗余之痛：当前匿名函数的困境

提案核心：轻量级语法的设想

社区的激辩：争议焦点与权衡

1. 可读性 vs. 简洁性

2. 语法选择的困境

箭头语法 (=> 或 ->)：

保留 func 并简化：

其他符号：

3. 隐式返回 (Implicit Return)

4. 类型推断的复杂性与边界

5. 对 Go 语言哲学的影响

最新动向：为何“可能被拒绝”？

影响与未来展望

小结

原子操作的瓶颈与Go的多核扩展性之痛：深入剖析sync.ShardedValue及per-CPU提案

原子操作为何在高并发多核下“失速”？sync.RWMutex 的痛点

社区的先行者：jonhoo/drwmutex 的分片读写锁实践

官方的早期探索：sync.ShardedValue 的初心与挑战 (#18802)

新的尝试：valyala 的 sync.PLocalCache (#69229) 与 sync.MLocal (#73667)

这些提案的共性、差异与启示

展望未来：Go 如何更好地拥抱多核时代？

小结

参考资料

文章

评论

分类

归档

链接

开源项目

翻译项目

标签 泛型 下的文章

Go的简洁性之辩：轻量级匿名函数提案为何七年悬而未决？

冗余之痛：当前匿名函数的困境

提案核心：轻量级语法的设想

社区的激辩：争议焦点与权衡

1. 可读性 vs. 简洁性

2. 语法选择的困境

箭头语法 (=> 或 ->)：

保留 func 并简化：

其他符号：

3. 隐式返回 (Implicit Return)

4. 类型推断的复杂性与边界

5. 对 Go 语言哲学的影响

最新动向：为何“可能被拒绝”？

影响与未来展望

小结

原子操作的瓶颈与Go的多核扩展性之痛：深入剖析sync.ShardedValue及per-CPU提案

原子操作为何在高并发多核下“失速”？sync.RWMutex 的痛点

社区的先行者：jonhoo/drwmutex 的分片读写锁实践

官方的早期探索：sync.ShardedValue 的初心与挑战 (#18802)

新的尝试：valyala 的 sync.PLocalCache (#69229) 与 sync.MLocal (#73667)

这些提案的共性、差异与启示

展望未来：Go 如何更好地拥抱多核时代？

小结

参考资料

文章

评论

分类

标签

归档

链接

开源项目

翻译项目

标签泛型下的文章