标签 编译器 下的文章

TypeScript 编译器 Go 重写版提速 10 倍:微软团队深度揭秘幕后工程细节

本文永久链接 – https://tonybai.com/2026/01/27/typescript-compiler-go-rewrite-10x-speed-microsoft-details

大家好,我是Tony Bai。

“JavaScript 是一门很棒的语言,但它并不是为了编写编译器而设计的。”

备受瞩目的 TypeScript 编译器 Go 重写版(代号 TypeScript 7.0)已经取得了惊人的 10 倍性能提升。在最近的 GopherCon 2025 上,来自 Microsoft TypeScript 团队的 Jake Bailey 带来了一场干货满满的分享,深度揭秘了这场跨语言大迁徙背后的工程挑战与技术细节。

为什么最终选择了 Go?庞大的 AST 如何在 Go 中高效表达?又是如何通过并发设计打破 Node.js 的性能枷锁的?本文将带你深入编译器内部,一探究竟。

img{512x368}

缘起:当 JavaScript 触碰到天花板

TypeScript 自 2012 年发布以来,一直采用“自举” (Self-hosting) 的方式,即用 TypeScript 编写 TypeScript 编译器。这带来了巨大的好处:团队能第一时间吃自己的狗粮,社区贡献也极其方便。

然而,JavaScript 并不是为了编写高性能编译器而设计的。随着代码库规模的爆炸式增长(如 VS Code 的 150 万行代码),基于 Node.js 的编译器逐渐触碰到了性能天花板:

  • 单线程与内存限制:JavaScript 无法高效利用多核 CPU,且 Node.js 构建环境(如 Electron)常常面临 4GB 内存上限,导致大型项目编译时频繁 OOM。
  • 昂贵的对象模型:JavaScript 的对象模型开销巨大,而编译器需要创建数以百万计的 AST 节点,这对内存和 GC 都是沉重的负担。
  • 异步的代价:async/await 虽然方便,但带来了著名的“函数着色”问题,且 Promise 对象的分配本身就有非零的运行时开销。

尽管团队已经用尽了 JIT 优化、缓存、单态化 (monomorphization) 等高级手段,但性能提升的边际效应越来越小,OOM 问题依然挥之不去。移植到另外一种语言,成为了打破僵局的唯一选择。

明确目标:新编译器的硬性指标

既然决定要移植到新语言,那么新语言必须解决 JavaScript 的痛点,同时不能丢失现有的优势。团队列出了几条不可妥协的硬性指标:

  1. 极致速度:必须编译为原生机器码 (Native Code),摆脱解释器和 JIT 的预热开销。
  2. 共享内存并发:这是性能翻盘的关键。新语言必须对多线程共享内存有强力支持,以便充分压榨多核性能。
  3. 跨平台支持:必须能运行在所有主流操作系统上,最重要的是——必须能编译为 WebAssembly,以确保在浏览器环境(如 vscode.dev)中的体验。
  4. 无缝移植:鉴于 TypeScript 没有正式的语言规范(Spec),现有的编译器实现就是事实上的规范。因此,新语言必须能够最大程度地保留原有代码的结构和逻辑,以确保行为的一致性。

正是这几条苛刻的标准,将选型的范围迅速缩小。

选型:为什么是 Go?

在考察了 Rust、C#、Zig 等语言后,Go 脱颖而出。Jake 透露了核心的决策逻辑:

  1. 带 GC 的内存管理:编译器涉及大量复杂的、循环引用的数据结构(如 AST 节点),“手动”管理内存(如 Rust)会带来巨大的心智负担和开发成本。Go 的 GC 完美契合这一需求。
  2. 结构相似性:TypeScript 的代码风格(无类、大量函数和接口)与 Go 非常相似。这使得“移植”而非“重写”成为可能。
  3. 学习曲线平缓:团队中大部分是 TypeScript 专家而非系统编程专家。Go 的简单性让团队能迅速上手。
  4. 跨平台与性能:Go 编译为原生机器码,天生支持高并发,且能轻松跨平台(包括编译为 WASM)。

Go完美地契合了TypeScript编译器移植的需求!

早期验证:手写原型与意外惊喜

在决定全面转向 Go 之前,团队并未贸然行动,而是采取了稳健的“原型验证”策略。

他们从编译器的最底层——扫描器 (Scanner) 和解析器 (Parser)——开始,尝试手工将 TypeScript 代码逐行“翻译”为 Go 代码。与此同时,为了确保决策万无一失,还有几位成员试探性地尝试了其他语言方案。

结果令人振奋:即使是初步的手写 Go 代码,解析速度也达到了原版的 5 倍左右!

更重要的是,团队惊喜地发现,手写的 Go 代码在结构和逻辑上与原始的 TypeScript 代码惊人地相似。这种代码形态上的高度一致性,不仅验证了 Go 是正确的选择,更为后续大规模自动化工具的开发注入了强心剂。

移植实战:从 ts-to-go 到并发革命

1. 自动化移植工具:ts-to-go

为了加速迁移,Jake 编写了一个 ts-to-go 工具,能将 TypeScript 代码“直译”为 Go 代码。

  • TS 的 interface -> Go 的 interface
  • TS 的 class -> Go 的 struct + methods
  • 复杂的位运算和逻辑判断 -> 自动转换为 Go 的等价写法

虽然不能 100% 完美转换,但这让团队在初期就能获得一个“虽然丑但能跑”的版本,极大加速了进程。

2. 数据结构的重新设计

在 JavaScript 中,对象是动态的;在 Go 中,一切皆有类型。团队不得不对 AST 的数据结构进行大刀阔斧的改革。

  • 消除 interface 滥用:最初的移植版本大量使用 interface 来模拟 TS 的多态,导致了巨大的内存开销(胖指针)和 nil 检查地狱。
  • 拥抱 struct 嵌入:最终,他们设计了一个基础 Node 结构体,并将其嵌入到所有具体的 AST 节点中。这不仅减少了内存占用,还彻底解决了 nil 接口的问题。

3. 并发:性能提升的核心引擎

这是 Go 带来的最大红利。旧的 TS 编译器是单线程的,解析、绑定、检查、生成都在一条线上排队。

而在 Go 版本中:

  • 解析 (Parsing):每个文件可以独立解析,完全并行。
  • 绑定 (Binding):每个文件的符号绑定也是独立的,完全并行。
  • 类型检查 (Type Checking):这是最难的部分,因为文件间存在复杂的依赖。团队采用了“独立检查器” (Independent Checkers) 的模式,为每组文件分配一个独立的检查器,虽然会有少量重复工作,但实现了高度的并行化。

结果是惊人的:VS Code 的编译时间从 80 秒缩短到了 7 秒,速度提升超过 10 倍!

踩坑与优化:Go 也没那么简单

当然,移植过程并非一帆风顺。Jake 分享了几个典型的“水土不服”案例:

  • 影子变量 (Shadowing):Go 允许在内层作用域遮蔽外层变量(如 err、result等),这导致了无数隐蔽的 Bug。Jake 甚至为此专门写了一个静态分析工具(https://jakebailey.dev/posts/go-shadowing)来抓这些虫子。
  • 方法值的分配:在 Go 中,将方法作为值传递(如 parser.LookAhead)会产生一次内存分配。在一个频繁调用的紧密循环中,这带来了 17% 的性能损耗。解决方案是改回显式的函数调用。
  • 字符串拼接:JavaScript 引擎对字符串拼接有深度优化(Cons-string),而 Go 的 + 操作符则是实打实的内存拷贝。这导致初期的移植版本在处理大量字符串时性能惨不忍睹。

遗憾与取舍:那些我们怀念的 TypeScript 特性

正如 Jake 在演讲中所言,这次迁移是一场巨大的工程胜利,但也是一次充满妥协的旅程。从表达力丰富的 TypeScript 转向“极简主义”的 Go,团队不得不忍痛割爱,放弃了许多令人怀念的语言特性:

  • 编译期空值安全 (Compile-time nil safety):这是团队最怀念的特性。在 Go 中,空指针异常(Panic)依然是悬在头顶的达摩克利斯之剑,而在 TypeScript 中,null/undefined 是类型系统的一部分,能被编译器严格检查。
  • 空值合并与链式调用 (??, ?.):Go 缺乏这些语法糖,使得代码中充斥着冗长的 if x != nil 检查,远不如 TypeScript 优雅。
  • 联合类型与类型收窄 (Union types, narrowing):TypeScript 强大的联合类型让数据建模极其灵活,而在 Go 中,这不得不退化为接口或带有大量字段的结构体。
  • 泛型方法与三元运算符:这些“现代化”特性的缺失,让从前端背景转过来的工程师们颇感不适。

然而,对于编译器团队来说,为了性能,这一切“阵痛”都是值得的。他们用语法的繁琐换取了运行时的极速,这正是工程世界中最经典的“等价交换”。

注:关于泛型方法,Go团队很大可能将在Go 1.27支持!

未来展望:TypeScript 7.0

目前,Go 版本的编译器已经能通过 10 万个测试用例,并在 Slack、Figma 等大厂的内部构建中试运行(Slack 的构建时间从 6 分钟降至 40 秒)。

Microsoft 计划在 TypeScript 6.0 中开始引入一些破坏性变更,为 Go 版本的上位做铺垫。而那个完全由 Go 驱动、极速的编译器,预计将被命名为 TypeScript 7.0

这场从 Node.js 到 Go 的大迁徙,不仅证明了 Go 在复杂编译器领域的工程能力,也为所有面临类似性能瓶颈的团队,提供了一个极具参考价值的范本。

注:微软在2025年12月初发布了TypeScript 7.0的最新进展,大家可以在 https://devblogs.microsoft.com/typescript/progress-on-typescript-7-december-2025/ 这里了解详情。

资料链接:https://www.youtube.com/watch?v=PZm_YbE3fcA


你的“重写”冲动

微软用 Go 重写 TS 编译器,是一次壮士断腕般的成功尝试。在你维护的项目中,是否有那个让你想要“推倒重来”的性能瓶颈?如果让你选,你会
用 Go 还是 Rust 来重写它?

欢迎在评论区分享你的重构经历或选型思考! 让我们一起探讨如何在性能与开发效率之间找到平衡。

如果这篇文章让你对 Go 在大型项目中的潜力有了新的认识,别忘了点个【赞】和【在看】,并转发给你的架构师朋友!


还在为“复制粘贴喂AI”而烦恼?我的新专栏 AI原生开发工作流实战 将带你:

  • 告别低效,重塑开发范式
  • 驾驭AI Agent(Claude Code),实现工作流自动化
  • 从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码,开启你的AI原生开发之旅。


你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

Go 的“浮点数陷阱”将被填平:浮点转整数即将在所有平台上行为一致

本文永久链接 – https://tonybai.com/2026/01/11/proposal-float-to-int-conversions-should-saturate-on-overflow

大家好,我是Tony Bai。

你是否知道,同一行简单的代码 int64(myFloat),在 Intel (amd64) 机器上可能返回一个巨大的负数,而在 ARM64 机器上却可能返回最大正整数?

在 Go 语言中,浮点数到整数的转换溢出行为长期以来一直属于“实现定义”(implementation-dependent) 的灰色地带。这意味着,代码的运行结果竟然取决于你底层的 CPU 架构。这种不确定性,一直是跨平台开发中一个难以察觉的隐形地雷。

2025年末,Go 编译器团队核心成员 David Chase 提交了一份提案(#76264),旨在彻底终结这种混乱。该提案计划在未来的 Go 版本中,强制规定所有平台上的浮点转整数必须是“饱和”的 (saturating),从而实现真正的全平台行为一致。

img{512x368}

痛点:薛定谔的转换结果

在现有的 Go 规范下,如果你尝试将一个超出目标整数范围的浮点数(例如 1e100)转换为 int64,结果是未定义的。

让我们看看这有多疯狂。假设我们有以下代码:

var f float64 = 1e100 // 一个巨大的数
var i int64 = int64(f)
fmt.Println(i)

这段代码在不同架构下的运行结果截然不同:

  • ARM64, RISC-V: 返回 9223372036854775807 (MAX_INT64)。这是“饱和”行为,即卡在最大值。
  • AMD64 (x86-64): 返回 -9223372036854775808 (MIN_INT64)。这是一个令人困惑的溢出结果。
  • WASM: 行为又不一样…

更糟糕的是 NaN (Not a Number) 的转换:

var j int64 = int64(math.NaN())
fmt.Println(j)
  • ARM64: 返回 0。
  • AMD64: 返回 MIN_INT64
  • RISC-V: 返回 MAX_INT64

这种不一致性不仅仅是理论问题,它已经导致了准标准库 x/time/rate 中的真实 Bug (#71154)。当你的代码逻辑依赖于转换结果的正负号来做判断时(例如 if i > 0),这种硬件差异就是致命的。

解决方案:拥抱“饱和转换”

David Chase 的提案非常直接:统一行为,拥抱饱和。

所谓“饱和转换”,是指当浮点数超出目标整数的表示范围时,结果应该被“钳制”在目标类型的最大值或最小值,而不是发生回绕(wraparound)或产生随机值。

具体规则如下:

  1. 正溢出 -> 返回目标类型的 最大值 (MaxInt)。
  2. 负溢出 -> 返回目标类型的 最小值 (MinInt)。
  3. NaN -> 返回 0 (或归一化为 0)。

这一改变将使得 Go 代码在任何 CPU 架构上都表现出完全一致的逻辑,彻底消除了这类可移植性隐患。

深层权衡:一致性 vs. 性能

为什么 Go 以前不这么做?核心原因在于性能成本

在 ARM64 和 RISC-V 等现代架构上,硬件指令集(如 FCVT)原生支持饱和转换,因此这样做几乎没有额外开销。

然而,AMD64 (x86-64) 是个“异类”。它的 CVTTSD2SQ 指令在溢出时不仅返回一个特殊的“不定值”(通常是 MinInt),还会触发浮点异常。为了在 AMD64 上模拟出“饱和”行为,编译器必须插入额外的检查代码:

// 模拟代码逻辑:AMD64 上的额外开销
result = int64(x)
if result == MIN_INT64 { // 可能溢出了
    if x > 0 {
        result = MAX_INT64 // 正溢出修正
    } else if !(x < 0) {
        result = 0         // NaN 修正
    }
}

Go 核心团队成员 Ian Lance Taylor 在评论中指出,我们必须权衡:为了消除这种不一致性,值得让 AMD64 上的转换操作变慢吗?

提案作者 David Chase 的回应是:值得。 与 FMA (融合乘加) 指令带来的微小精度差异不同,浮点转整数的差异往往是正负号级别的(MaxInt vs MinInt),这直接决定了代码逻辑的走向(循环是否执行、条件是否满足)。这种差异带来的 Bug 极其隐蔽且难以调试,其代价远超那几条指令的性能损耗。

实施计划:温和的演进

为了避免生态系统的剧烈震荡,提案建议采用分阶段的落地策略:

  • Go 1.26: 引入 GOEXPERIMENT 标志,允许开发者尝鲜并测试影响。
  • Go 1.27: 将其设为默认的实现行为。
  • Go 1.28: 正式修改 Go 语言规范 (Spec),将其确立为标准。

注:Go 1.26当前已经功能冻结,该提案依然处于Go语言规范变更审查委员会的讨论状态中,因此即便逻辑,其实际落地时间表也会顺延。

小结:Go 向“完美可移植性”迈出的重要一步

Dr Chase的这个提案不仅是对一个技术细节的修正,更是 Go 语言设计哲学的一次体现:在工程实践中,可预测性和可移植性往往优于特定平台上的极致微优化。

如果该提案通过,未来的 Gopher 们将不再需要担心底层的 CPU 是 Intel 还是 ARM,int64(NaN) 永远是 0,int64(Inf) 永远是 MaxInt64。这,才是我们想要的“Write Once, Run Anywhere”。

注:目前Dr Chase也在努力弥合amd64下的性能差距。

资料链接:https://github.com/golang/go/issues/76264


你的跨平台“血泪史”

跨平台开发中的“未定义行为”往往是最难调试的 Bug。在你的开发生涯中,是否也遇到过因为 CPU 架构或操作系统差异而导致的诡异问题?你支持为了“一致性”而牺牲一点点 AMD64 上的性能吗?

欢迎在评论区分享你的踩坑经历或对提案的看法! 让我们一起见证 Go 语言的进化。

如果这篇文章让你对底层原理有了新的认识,别忘了点个【赞】和【在看】,并转发给你的硬核伙伴!


还在为“复制粘贴喂AI”而烦恼?我的新专栏 AI原生开发工作流实战 将带你:

  • 告别低效,重塑开发范式
  • 驾驭AI Agent(Claude Code),实现工作流自动化
  • 从“AI使用者”进化为规范驱动开发的“工作流指挥家”

扫描下方二维码,开启你的AI原生开发之旅。


你的Go技能,是否也卡在了“熟练”到“精通”的瓶颈期?

  • 想写出更地道、更健壮的Go代码,却总在细节上踩坑?
  • 渴望提升软件设计能力,驾驭复杂Go项目却缺乏章法?
  • 想打造生产级的Go服务,却在工程化实践中屡屡受挫?

继《Go语言第一课》后,我的《Go语言进阶课》终于在极客时间与大家见面了!

我的全新极客时间专栏 《Tony Bai·Go语言进阶课》就是为这样的你量身打造!30+讲硬核内容,带你夯实语法认知,提升设计思维,锻造工程实践能力,更有实战项目串讲。

目标只有一个:助你完成从“Go熟练工”到“Go专家”的蜕变! 现在就加入,让你的Go技能再上一个新台阶!


商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。如有需求,请扫描下方公众号二维码,与我私信联系。

如发现本站页面被黑,比如:挂载广告、挖矿等恶意代码,请朋友们及时联系我。十分感谢! Go语言第一课 Go语言进阶课 AI原生开发工作流实战 Go语言精进之路1 Go语言精进之路2 Go语言第一课 Go语言编程指南
商务合作请联系bigwhite.cn AT aliyun.com
这里是 Tony Bai的个人Blog,欢迎访问、订阅和留言! 订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠 ,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:

如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:

以太币:

如果您喜欢通过微信浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:
本站Powered by Digital Ocean VPS。
选择Digital Ocean VPS主机,即可获得10美元现金充值,可 免费使用两个月哟! 著名主机提供商Linode 10$优惠码:linode10,在 这里注册即可免费获 得。阿里云推荐码: 1WFZ0V立享9折!


View Tony Bai's profile on LinkedIn
DigitalOcean Referral Badge

文章

评论

  • 正在加载...

分类

标签

归档



View My Stats