API - Tony Bai

近期learnk8s网站上发布了一些关于k8s的好文章，这里搬运并翻译了一些，供大家参考。

本文翻译自《Architecting Kubernetes clusters — choosing a worker node size》。

img{512x368}

当您创建Kubernetes集群时，冒出的第一个问题之一是：“我应该使用哪种类型的工作节点以及需要多少个这样的节点”。

如果您正在构建在内部部署的k8s集群，是应该订购一些最近一代的新服务器，还是使用数据中心内的十几台旧机器？

或者，如果您使用Google Kubernetes Engine（GKE）等托管Kubernetes服务，您是否应该使用八个n1-standard-1或两个n1-standard-4实例来实现所需的计算能力呢？

集群容量

通常，Kubernetes集群可以被视为将一组单个节点抽象为一个大的“超级节点”。

该超级节点的总计算容量（就CPU和内存而言）是所有组成节点容量的总和。

有多种方法可以实现集群的所需目标容量。

例如，假设您需要一个总容量为8个CPU内核和32 GB RAM的集群。

例如，因为要在集群上运行的应用程序集需要如此数量的资源。

以下是设计集群的两种可能方法：

img{512x368}

这两个选项都会产生具有相同容量的集群 – 但左侧选项使用4个较小的节点，而右侧选项使用2个较大的节点。

哪个更好？

为了解决这个问题，让我们来看看“少数大节点”和“许多小节点”这两个相反方向思路的优缺点。

请注意，本文中的“节点”始终指的是工作节点(worker node)。master节点的数量和大小的选择是完全不同的话题。

使用少量大节点

这方面最极端的情况是仅使用一个可以提供整个所需集群容量的工作节点。

如果要满足上面的示例中容量的需求，这将是一个具有16个CPU内核和16 GB RAM的单个工作节点。

让我们来看看这种方法可能具有的优势。

1. 减少管理成本

简单地说，管理少量机器比管理大量机器要更省力。

更新和补丁可以更快地应用，机器可以更容易保持同步。

此外，对于机器数量少而言，预期故障的绝对数量要小于机器数量多的情况。

但请注意，这主要适用于裸机服务器而不适用于云实例。

如果您使用云实例（作为托管Kubernetes服务的一部分或您在云基础架构上安装的Kubernetes），则将底层机器的管理外包给云提供商。

因此，管理云中的10个节点并不比管理云中的单个节点成本多得多。

2. 每个节点的成本更低

虽然更强大的机器比低端机器更昂贵，但价格上涨不一定是线性的。

换句话说，具有10个CPU内核和10 GB RAM的单台机器可能比具有1个CPU内核和1 GB RAM的10台机器便宜。

但请注意，如果您使用云实例，这可能同样不适用。

在主要云提供商Amazon Web Services，Google Cloud Platform和Microsoft Azure的当前定价方案中，实例价格是随容量线性增加的。

例如，在Google Cloud Platform上，64个n1-standard-1实例的成本与单个n1-standard-64实例完全相同- 两个选项都为您提供64个CPU内核和240 GB内存。

因此，在云中，您通常无法通过使用更大的机器来节省成本。

3. 允许运行资源消耗较大的应用程序

拥有大型节点可能只是您要在集群中运行一类应用程序的要求。

例如，如果您有一台需要8 GB内存的机器学习应用程序，你无法在仅具有1 GB内存的节点的集群上运行它。

但是，您可以在具有10 GB内存节点的群集上运行它。

看过优势后，让我们再来看看其弊端又是什么。

1. 每个节点有大量的pod

在较少的节点上运行相同的工作负载自然意味着在每个节点上运行更多的pod。

这可能成为一个问题。

原因是每个pod都会在节点上运行的Kubernetes代理上引入一些开销 – 例如容器运行时（例如Docker），kubelet和cAdvisor。

例如，kubelet对节点上的每个容器执行常规活动和就绪探测 – 更多容器意味着在每次迭代中kubelet需要做更多的工作。

cAdvisor收集节点上所有容器的资源使用统计信息，并且kubelet定期查询此信息并通过其API发布它 – 再次，这意味着每次迭代中cAdvisor和kubelet的工作量都会增加。

如果pod的数量变大，这些东西可能会开始减慢系统速度，甚至使系统变得不可靠。

img{512x368}

有issue称节点因常规的kubelet运行状况检查花费了太长时间来迭代节点上的所有容器而导致节点处于非就绪状态。

出于这些原因，Kubernetes 建议每个节点最多110个pod。

针对这个数字，Kubernetes已经做过测试，结果证明是可以在通常节点类型上可靠地工作的。

根据节点的性能，您可能能够成功地为每个节点运行更多的pod – 但这依然很难预测事情是否会顺利运行，又或您将遇到问题。

大多数托管Kubernetes服务甚至对每个节点的pod数量施加了严格的限制：

在Amazon Elastic Kubernetes Service（EKS）上，每个节点的最大pod数取决于节点类型，范围从4到737。
在Google Kubernetes Engine（GKE）上，无论节点类型如何，每个节点的限制为100个pod。
在Azure Kubernetes服务（AKS）上，默认限制是每个节点30个pod，但最多可以增加到250个。

因此，如果您计划为每个节点运行大量pod，则应该事先测试事情是否能按预期工作。

2. 有限的复制

少量节点可能会限制应用程序的有效复制程度。

例如，如果您有一个由5个副本组成的高可用性应用程序，但您只有2个节点，那么应用程序的有效复制程度将减少到2。

这是因为5个副本只能分布在2个节点上，如果其中一个失败，它可能会同时删除多个副本。

另一方面，如果您有至少5个节点，则理想情况下每个副本可以在单独的节点上运行，并且单个节点的故障最多只会删除一个副本。

因此，如果您具有高可用性要求，则可能需要对集群中的最小节点数提出要求。

3. 更大的爆破半径

如果您只有几个节点，那么失败节点的影响比您有许多节点的影响要大。

例如，如果您只有两个节点，并且其中一个节点出现故障，那么大约一半的节点会消失。

Kubernetes可以将失败节点的工作负载重新安排到其他节点。

但是，如果您只有几个节点，则风险更高，因为剩余节点上没有足够的备用容量来容纳故障节点的所有工作负载。

结果是，部分应用程序将永久停机，直到再次启动故障节点。

因此，如果您想减少硬件故障的影响，您可能希望选择更多的节点。

4. 大比例增量

Kubernetes 为云基础架构提供了一个Cluster Autoscaler，允许根据当前需求自动添加或删除节点。

如果使用大型节点，则会有大的缩放增量，这会使缩放更加笨重。

例如，如果您只有2个节点，则添加其他节点意味着将群集容量增加50％。

这可能比您实际需要的多得多，这意味着您需要为未使用的资源付费。

因此，如果您计划使用集群自动缩放，则较小的节点允许更流畅且经济高效的缩放行为。

在讨论了使用”很少几个大节点”的方案的优缺点之后，让我们转向”许多小节点”的场景。

使用大量小节点

这种方法包括从许多小节点而不是几个大节点中形成集群。

这种方法的优点和缺点是什么？

使用许多小节点的优点主要对应于使用少量大节点的缺点。

1. 较小的爆破半径

如果您有更多节点，则每个节点上的pod自然会更少。

例如，如果您有100个pod和10个节点，则每个节点平均只包含10个pod。

因此，如果其中一个节点发生故障，则影响仅限于总工作负载的较小比例。

有可能只有一些应用程序受到影响，并且可能只有少量副本，因此整个应用程序都会保持运行状态。

此外，剩余节点上的备用资源很可能足以容纳故障节点的工作负载，因此Kubernetes可以重新安排所有pod，并且您的应用程序可以相对快速地返回到完全正常运行的状态。

2. 允许高可复制性

如果您有高可用性需求的应用程序和足够的可用节点，Kubernetes调度程序可以将每个副本分配给不同的节点。

您可以通过节点亲缘关系，pod亲和力/反亲和力以及taint和tolerations来影响调度程序对pod放置位置的选择。

这意味着如果某个节点出现故障，则最多只有一个副本受影响且您的应用程序仍然可用。

看到使用许多小节点的优点，那它有什么缺点呢？

1. 节点数量大

如果使用容量较小的节点，则自然需要更多节点来实现给定的集群容量。

但是大量节点对Kubernetes控制平面来说可能是一个挑战。

例如，每个节点都需要能够与每个其他节点通信，这使得可能的通信路径数量以节点数量的平方的量级增长 – 所有节点都必须由控制平面管理。

Kubernetes控制器管理器中的节点控制器定期遍历集群中的所有节点以运行运行状况检查 – 更多节点意味着节点控制器的负载更多。

更多节点意味着etcd数据库上的负载也更多 – 每个kubelet和kube-proxy都会导致etcd的观察者(watch)客户端（通过API服务器），etcd必须广播对象更新。

通常，每个工作节点都会给主节点上的系统组件增加一些开销。

img{512x368}

据官方统计，Kubernetes声称支持最多5000个节点的集群。

然而，在实践中，500个节点可能已经构成了较大的挑战。

通过使用性能更高的主节点，可以减轻大量工作节点的影响。

这就是在实践中所做的 – 这里是kube-up在云基础架构上使用的主节点大小：

Google云端平台
- 5个工作节点→ n1-standard-1主节点
- 500个工作节点→ n1-standard-32主节点
亚马逊网络服务
- 5个工作节点→ m3.medium主节点
- 500个工作节点→ c4.8xlarge主节点

如您所见，对于500个工作节点，使用的主节点分别具有32和36个CPU核心以及120 GB和60 GB内存。

这些都是相当大的机器！

因此，如果您打算使用大量小节点，则需要记住两件事：

您拥有的工作节点越多，您需要的性能就越高
如果您计划使用超过500个节点，则可能会遇到一些需要付出一些努力才能解决的性能瓶颈

像Virtual Kubelet这样的新项目允许绕过这些限制，并允许具有大量工作节点的集群。

2. 更多系统开销

Kubernetes在每个工作节点上运行一组系统守护进程 – 包括容器运行时（例如Docker），kube-proxy和包含cAdvisor的kubelet。

cAdvisor包含在kubelet二进制文件中。

所有这些守护进程一起消耗固定数量的资源。

如果使用许多小节点，则这些系统组件使用的资源部分比例会更大。

例如，假设单个节点的所有系统守护程序一起使用0.1个CPU内核和0.1 GB内存。

如果您拥有10个CPU核心和10 GB内存的单个节点，那么守护程序将占用集群容量的1％。

另一方面，如果您有1个CPU核心和1 GB内存的10个节点，则后台程序将占用集群容量的10％。

因此，在第二种情况下，10％的账单用于运行系统，而在第一种情况下，它只有1％。

因此，如果您希望最大化基础架构支出的回报，那么您可能更喜欢更少的节点。

3. 降低资源利用率

如果您使用较小的节点，那么最终可能会有大量资源片段太小而无法分配给任何工作负载，因此保持未使用状态。

例如，假设您的所有pod都需要0.75 GB的内存。

如果你有10个1 GB内存的节点，那么你可以运行10个这些pod – 你最终会在每个节点上有一块0.25 GB的内存，你不能再使用它了。

这意味着，集群总内存的25％被浪费了。

另一方面，如果您使用具有10 GB内存的单个节点，那么您可以运行13个这样的pod – 而只有0.25 GB的单块内存剩下无法使用。

在这种情况下，您只会浪费2.5％的内存。

因此，如果您想最大限度地减少资源浪费，使用更大的节点可能会提供更好的结果。

4. 小节点上的Pod限制

在某些云基础架构上，小节点上允许的最大pod数量比您预期的要限制得多。

Amazon Elastic Kubernetes Service（EKS）就是这种情况，其中每个节点的最大pod数取决于实例类型。

例如，对于一个t2.medium实例，pod的最大数量是17，因为t2.small它是11，而t2.micro它是4。

这些都是非常小的数字！

任何超出这些限制的pod都无法由Kubernetes调度程序安排，这些pod会一直保持在Pending状态。

如果您不了解这些限制，则可能导致难以发现的错误。

因此，如果您计划在Amazon EKS上使用小节点，请检查相应的每节点pods数，并多算几次计算节点是否可以容纳所有pod。

结论

那么，您应该在集群中使用少量大型节点还是许多小型节点？

一如既往，没有明确的答案。

您要部署到集群的应用程序类型可能会指导您的决策。

例如，如果您的应用程序需要10 GB内存，则可能不应使用小节点 – 集群中的节点应至少具有10 GB内存。

或者，如果您的应用程序需要10倍的复制性以实现高可用性，那么您可能不应该只使用2个节点 – 您的集群应该至少有10个节点。

对于中间的所有场景，它取决于您的具体要求。

以上哪项优缺点与您相关？哪个不是？

话虽如此，没有规则规定所有节点必须具有相同的大小。

没有什么能阻止您在集群中使用不同大小节点混合在一起的方案。

Kubernetes集群的工作节点可以是完全异构的。

这可能会让您权衡两种方法的优缺点。

最后，证明布丁好坏就在于吃 – 最好的方法是试验并找到最适合你的组合！

我的网课“Kubernetes实战：高可用集群搭建、配置、运维与应用”在慕课网上线了，感谢小伙伴们学习支持！

我爱发短信：企业级短信平台定制开发专家 https://tonybai.com/
smspush : 可部署在企业内部的定制化短信平台，三网覆盖，不惧大并发接入，可定制扩展；短信内容你来定，不再受约束, 接口丰富，支持长短信，签名可选。

著名云主机服务厂商DigitalOcean发布最新的主机计划，入门级Droplet配置升级为：1 core CPU、1G内存、25G高速SSD，价格5$/月。有使用DigitalOcean需求的朋友，可以打开这个链接地址：https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

我的联系方式：

微博：https://weibo.com/bigwhite20xx
微信公众号：iamtonybai
博客：tonybai.com
github: https://github.com/bigwhite

微信赞赏：
img{512x368}

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

本文是首发于个人微信公众号的文章“TB一周萃选[第10期]”的归档。

img{512x368}

这个世界上最危险的毒药，就是成就感。而解药就是每晚都想一想，明天如何做得更好。 – 英格瓦坎普拉德，宜家创始人

2018年元宵节已过，这个传统意义上的年就算真的过完了，我们的那颗有些闲散、有些懈怠的心需要收一收，是时候为2018年的“事业”做些规划，从2018的起跑线上起跑出去了。就连现在的孩子，在开学第一课时都要对自己的寒假生活做生动的回顾并且对新学期给予展望了。

img{512x368}

春节假期匆忙且短暂，不过在这段时间里还是有很多值得关注的文章、资料、书籍以及项目的。

一、一周文章精粹

1. Go官方提出新的包依赖管理工具：vgo

就在上周，Go社区里发生了一件“大事”：Go大神Russ Cox一周内连发了七篇文章，并宣布Go很可能在下一个版本：Go 1.11中加入可选的、“实验性”的新模型： vgo(versioned Go)，以试图解决长期以来Go被广泛诟病的包依赖管理问题。

Russ Cox在设计vgo时参考了当今比较流行的cargo、npm等工具，也从之前Go官方实验dep中吸取了足够的实验结论，另辟蹊径，提出了很多很有创新的观点和方法，在社区里引起了广泛的关注和讨论。

vgo的一些主要设计考量如下：

接受语义版本(semver)规则
使用semantic import versioning规则替代原有的import rule
引入module概念（go.mod)
使用minimal version selection(最小版本选择)，而不是业界事实标准的maximal version selected（最新版本选择）的方案；
去除vendor机制
去除GOPATH

Russ Cox还提供了一个vgo的初步实现，供广大Gopher体验。

vgo的公开意味着Go team已经将包依赖管理问题列为高优先级待解决的问题，vgo虽然只是原型，其设计思路也可能不会全部进入到最终的解决方法中，但这毕竟迈出了坚实的一步。

文章链接：Go & Verisioning

2. Go官方2017用户调查结果

本周Go官方在Blog上公布了2017用户调查结果，几个结论值得大家关注：

越来越多用户在工作中正式使用Go (67%)
Web开发、系统编程、Devops、网络编程依旧是Go使用的主要领域，但在移动端、桌面端GUI编程的比例下滑明显
在API/RPC服务领域的使用占据榜首，CLI、WebService(返回html)排名2、3
包依赖管理以及缺少泛型依然是Gopher最希望Go team解决的两个问题
Linux、MacOS依然是Gopher主力开发平台
vscode在Go编辑器市场份额升至No.1
最喜欢的关键字：go、defer、func、select和interface排名top5

文章链接：“Go 2017用户调查结果”

3. 容器术语介绍入门

著名开源公司Redhat近两年拥抱容器的态度十分坚决，近期来收购了coreos。近期Redhat在官博上发表了一篇文章，对容器领域的相关术语概念做了详尽的介绍，强烈推荐。

文章链接：“容器术语介绍入门”

4. Go语言实现的微服务系列

Go语言已经被证明了是当前应用云化、面向微服务的服务端编程的头部语言之一。关于Go与Microservice的文章也有不少。Ewan Valentine的Go语言实现微服务系列（10篇）就是这类文章中难得的全面、细致讲述Go如何实现微服务应用的文章资料。在这一系列文章中，作者谈到的了mongodb, grpc, docker, Google Cloud, Kubernetes, NATS, CircleCI, Terraform、go-micro框架等诸多在编写、部署、运维微服务过程中所能用到的框架、协议、工具等。.

文章链接：microservice in golang series

5. Brian Ketelsen专访：Go取得快速增长的原因

Brian Ketelsen是知名Gopher，GopherCon大会、GopherAcademy的联合发起人、《Go in action》一书的联合作者。在Microsoft对其的一篇专访中，Brian Ketelsen谈了对Go语言这些年取得快速成长的看法。

文章链接：Brian Ketelsen专访：Go取得快速增长的原因

6. 在Linux上使用Go作为脚本语言

Cloudflare公司的很多产品采用的是Go技术栈，公司内部支撑系统亦是。Go的简单特质以及Go tools的使用模式让Go十分适合在Linux系统上被当做“脚本语言”使用（结合shebang行），它的强类型特性又是真正的脚本语言所不具备的。cloudflare的这篇文章讲解了该公司使用go作为脚本语言在Linux上的实践方法，值得借鉴。

文章链接：《在Linux使用Go作为脚本语言》

二、一周资料分享

1. Google机器学习速成教程

img{512x368}

Google公司本周正式推出面向普通开发者、机器学习爱好者的机器学习速成教程资料。粗略浏览了一遍，感觉该教程是目前传统程序员向机器学习、AI领域转型的最优秀资料之一。教程提供了教程中实验的全部资料和实验环境，并给出了前提条件中给出了预备知识的学习教程，包括数学知识、Python编程等。更为可贵的是该教程提供完整的中文版，国内程序员学习起来曲线也降低了不少。唯一不便的可能就是需要科学上网才能打开教程。

资料分享链接：“Google机器学习速成教程”

三、一周项目推荐

1. vitess

img{512x368}

之所以推荐vitess这个项目，是因为它在不久前成为了CNCF基金会的第16个孵化级别项目，并且是cncf第二个存储项目。Vitess最初是作为YouTube的一个内部解决方案来处理大量存储的扩展，它是一个数据库编排系统，通过广义分片来对MySQL进行水平缩放。通过封装分片路由逻辑，Vitess允许应用程序代码和数据库查询对于将数据分布到多个分片上保持不变。借助Vitess，组织甚至可以根据需求的增长来分割和合并碎片，原子切割步骤只需要几秒钟。

同时该项目还是Go语言的早期“尝鲜者”：在2011年就开始使用Go语言开发了。随着vitess用户的增多（包括slack、flipkart等），vitess似乎又进入一个黄金开发的阶段，将较为成熟的、业界广为使用的数据库分片技术继续延续和优化下去，并且vitess与容器、kubernetes的结合使用也日益成熟，为云原生应用在k8s上提供一个可扩展的存储层。

项目链接：“vitess”

四、一周图书推荐

1.《Master Ethereum》

img{512x368}

随着2017年比特币市场的异常繁荣，2018的区块链技术有迎来爆发的趋势。作为第二代区块链技术代表的以太坊(Ethereum)，它试图实现一个总体上完全无需信任基础的智能合约平台和庞大的生态圈，受到了区块链业界最为广泛的关注，有关以太坊的技术书籍亦是如此。

《Master Ethereum》，中文名可译为“精通以太坊”，这是一本尚未完成的书，但在编写的过程中就受到了广泛的关注。除了是因为大家对以太坊技术关注之外，该书在github的开源也是其吸引眼球的重要原因。该书的两位作者是bitcoin专家，本书的目标是为开发者提供有关以太坊概念、使用、智能合约(smart contract)、经典以太坊网络、以太坊标准等全面的内容。

图书链接：《Master Ethereum》

我的联系方式：

微博：https://weibo.com/bigwhite20xx
微信公众号：iamtonybai
博客：tonybai.com
github: https://github.com/bigwhite

微信赞赏：
img{512x368}

商务合作方式：撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。