如果服务器悄悄“猝死”,你的系统还能活几秒?揭秘分布式集群的“续命”保底机制

本文永久链接 – https://tonybai.com/2026/03/20/heartbeats-in-distributed-systems 大家好,我是Tony Bai。 在开发单体应用时,我们很少操心“服务器死没死”的问题——进程挂了就是挂了,整个服务直接 502。但在庞大的分布式系统和微服务架构中,最大的噩梦往往不是服务器彻底宕机,而是**“它悄悄死去了,但整个集群却以为它还活着”。** ...

March 20, 2026 · 8 min · Tony Bai

Jepsen 报告震动 Go 社区:NATS JetStream 会丢失已确认写入

本文永久链接 – https://tonybai.com/2025/12/11/jepsen-report-nats-jetstream-data-loss-acknowledged-writes 大家好,我是Tony Bai。 近日,一则重磅消息在 Go 社区引发了不小的震动。分布式系统领域的“终极拷问者”——Jepsen——发布了一份针对 Go 生态中流砥柱级消息系统 NATS 及其子系统 JetStream 的深度分析报告。 ...

December 11, 2025 · 7 min · Tony Bai