标签 github 下的文章

TB一周萃选[第9期]

本文是首发于个人微信公众号的文章“TB一周萃选[第9期]”的归档。

img{512x368}

亲情犹如一江剪不断的春水,流动的是游子心中永远的思念;亲情犹如一丘数不尽的细沙,沉淀的是长年堆积的牵挂;亲情犹如夜空中那颗北斗,指引的是那迷路的羔羊回家的方向。忙碌了一年,该回家了,给心放个假,带上媳妇带上你的娃,回家看看那年迈的爸妈,出发! — 改编自网络

此时此刻,很多人刚刚踏上了春节回家的旅途,有些人更是已经叩开了家的大门。每逢中国传统佳节-春节,令世界瞩目并为之瞠目结舌的中国式人口大迁移就会发生一次:几亿人熬夜刷票并不辞辛劳地携着夫/妻儿女,经由多种交通工具,跨越高山大河,不远千百里,战胜种种“囧况”,只为一个目的:在春节前回到那个充满熟悉味道的家乡。

这种在一个文明延续5000多年未中断的民族中发生的全民行为让西方社会感到十分不解,甚至指责这是对资源的一种浪费;并且也有国内的人发出类似不和谐的声音。但是它依然在发生着,每年都在发生,形式有些许变化,但剧情大体雷同。

曾经有国内外学者对中国特有的春节大迁徙的原因进行研究和分析,并给出了各种专业化的理由。但在我看来,对现代人来说,回家过年,是一种心灵的相互充电! 而且是充电7天,“通话”一整年

对于一年到头在外奔波劳碌的人们来说,只有回家,才能真实地触摸到自己的“根”,才能切切实实地体会这种归属感,才能在一定程度上纾解那些在工作的城市中涵盖不了的人生寄托。在这种归属感中,哪怕只是获得片刻的身心安宁,也是一种极为重要的精神能量的充电;而对于守候在家乡的父母或者孩童儿,你的回家,让他们将近一年的期盼终于有了一个圆满的结果,这同样为下一个365天的期盼周期提供了强大的动力和希望。

如果非要给这种行为找个理由,那我要说这就是由一个体内延绵数千年的中华民族血脉的中国人的基因所决定的。

img{512x368}

一、一周文章精粹

1. Go 1.10发布Party

自从Go 1.6开始,每逢偶数版本(一般在每年2、3月发布),Gopher社区都会举办庆祝Release的全球Party。在中国农历春节到来之际,也恰逢Go最新版本Go 1.10即将发布之时,Go wiki发布了Go 1.10 Release Party的Schedule和相关资料。截至目前,已经有15个Party已经list到页面上,活动从2月15号一直延续到3月份。

2. 避免或减少对Go context Value的使用

context包最初诞生于Google公司内部,并在Google内部项目大量使用。context在golang/x中孵化了多年,并得到了很多开源项目的使用,尤其是一些使用了”middleware”模式的项目中,于是在Go 1.7发布时,context包正式加入Go标准库。context加入后,可谓既带来魔力,亦带来了争议,甚至有人将其视为具有“病毒”属性,一旦使用,便可轻易传染到项目中代码的各个角落。

Go开发者、培训师Jon Calhoun也在个人网站上撰写了一篇文章,来告诫大家Go context value的一些缺陷,建议大家避免或减少对Go context Value的使用,并给出自己的替代方案。其主要理由是:context.WithValue和Context.Value的使用让我们失去了编译器对类型安全性的检查。

文章链接:“Pitfalls of context values and how to avoid or mitigate them in Go”

3. 来自Google Cloud Platform的12条有关用户账号、授权和密码管理的最佳实践

对于许多开发者来说,账户管理是一个黑暗的角落,没有得到足够的重视。来自Google Cloud Platform的解决方案专家Ian Maddox给我们带来了12条有关此方面的最佳实践,包括:区分用户标识与用户账号、允许用户更改用户名、用户ID大小写敏感、两步验证等。

img{512x368}

文章链接:“12 best practices for user account, authorization and password management”

4. AI界网红-深度学习之父Geoffrey Hinton的传奇学术生涯

这几年最火爆的人工智能技术就是深度学习,可以说当下的主流人工智能就是深度学习,而深度学习的理论基石就是反向传播。和当代物理学类似,最新的计算机应用实际上也是在消化几十年前就已经建立的理论,这不:反向传播就是Geoffrey Hinton与同事David Rumelhart、Ronald Williams在1986年发布的成果,Geoffrey Hinton也因此被誉为深度学习之父。Geoffrey Hinton花了30年在AI前沿的研究,在今天终于开花结果。不过这位现在AI奠基人并没有就此停歇,去年他还提出了“胶囊理论”,不过要彻底理解他的理论,不知道AI应用界还要花多久。下面这篇文章是“多伦多生活”上发表的一篇有关Geoffrey Hinton的传奇学术生涯的新闻稿,我们可以通过它一瞥AI超级明星的学术人生。

img{512x368}
图:Geoffrey Hinton

文章链接:“深度学习之父Geoffrey Hinton的传奇学术生涯”

5. Go项目在github上接受PR了

go语言自身的开发一直是在google内部的平台上,github上的golang项目仅仅是其一个mirror。在这之前,golang项目在github上是拒绝pr的,contributor必须注册google的开发账号才能为go语言本身做贡献,这种门槛显然有些高。近期Go项目作出了对社区更为友好的举动:允许在github上直接提交PR。不过代码的review依旧是在google原平台上,github上提交的pr将被GerritBot自动同步到Go team的Gerrit上进行code review。不过这已经是一个不错的开端了。估计会吸引更多开发者为Go做contribution。

文章链接:
* “doc: remove Pull Request note in README.md”
* “pr流程”

二、一周资料分享

1. istio微服务教程 by Redhat

下一代微服务平台日益火爆,比如:istioconduit等。近期Redhat开源了一套istio微服务教程,主要是for java microservice,但感觉对其他语言开发的微服务也适用。教程使用的是istio最新发布的0.5.0版本,底层使用的是redhat自身的oc平台(openshift),但替换成kubernetes应该很容易。教程包含的内容还是很全面的,针对包括metrics、tracing、routerule管理、fault injection、retry&timeout、mirroring traffic、access control、rate limiting、circuit breaker、egress等常见的微服务框架治理机制都提供了demo实例。

资料分享链接:Istio Tutorial for Java Microservices

三、一周项目推荐

1. rook:致力于让存储服务成为云原生平台上的“头等”服务

2018年1月30日,云原生cncf组织下又增加了一位新成员:rook项目,由于刚入行,其与linkerd、coredns同样处于Inception级别。rook是什么?它解决了哪些问题呢?

如今在Kubernetes上部署的应用在使用存储服务时,多使用k8s集群外提供的外部存储服务。在公有云上,使用较多的是诸如EBSS3等;在定制云/私有云中,使用的则是NFS、Ceph或更为传统的存储解决方案,如下图所示:

img{512x368}
图:使用rook前

Rook存在的意义就是将存储服务移入集群内部,让那些依赖存储服务的应用可以无缝地使用这些服务,这样一来,整个云原生集群环境就可以脱离厂商依赖(比如对amazon、google cloud platform的依赖),实现整体的可移植了,无论是公有云还是私有云。

img{512x368}
图:使用rook后

可以说,Rook让存储服务成为云原生平台上的“头等”服务,与其他应用服务一样。

那Rook究竟是什么呢?Rook不是一个像ceph那样的分布式共享存储系统。rook的考虑是:与其花费几年甚至十几年实现一个成熟的、久经考验的分布式存储系统,到不如帮助现有的已经十分成熟的、久经沙场的存储系统更方便的被云原生环境中的应用所使用,比如:ceph。于是rook通过将那些专有存储服务管理员的日常操作自动化:包括引导启动、配置、伸缩、升级、迁移、灾难恢复、监控、资源管理,将存储服务包装为云原生应用,无缝运行在云原生环境上,目前主要是在Kubernetes上。

img{512x368}
图:rook架构

Rook的出现,迅速得到了来自Redhat、ceph开发者的支持,社区也在日益壮大。目前其最新版本为v0.6.2,按计划在2018年中旬发布第一个production-ready的正式版。

项目地址:Rook

四、一周图书推荐

1.《High Performance Browser Networking》

img{512x368}

Ilya Grigorik是Google性能优化工程师,他在2013出版的这本《High Performance Browser Networking》堪称当代Web性能调优的圣经。该书以调优为核心,从网络基础(101)讲起,然后深入探讨了无线和移动网络的工作机制。最后,揭示了HTTP 协议的底层细节,同时详细介绍了HTTP 2.0、 XHR、SSE、WebSocket、WebRTC 和DataChannel 等现代浏览器新增的具有革命性的新能力。该书无论是对前端开发,还是后端网络服务开发设计人员都是大有裨益的。

更重要的是该书当时所讲述的诸多浏览器协议技术,比如:HTTP2.0、WebSocket、SSE在如今已经成为标准,并广泛应用于生产实践中。

图书链接:
英文版:《High Performance Browser Networking》
中文版:《Web性能权威指南》
免费版:《High Performance Browser Networking》


著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格5$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

我的联系方式:

微博:http://weibo.com/bigwhite20xx
微信公众号:iamtonybai
博客:tonybai.com
github: https://github.com/bigwhite

微信赞赏:
img{512x368}

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作

TB一周萃选[第7期]

本文是首发于个人微信公众号的文章“TB一周萃选[第7期]”的归档。

img{512x368}

我看过小马哥(哈维尔·马斯切拉诺)踢球,
你看过小马哥踢球,
他看过小马哥踢球。
我们看过小马哥踢球,
你们看过小马哥踢球,
他们看过小马哥踢球!

— 改编自网络资料

都说三九天是一年中最冷的一段时间,但我们这里稍有偏差,就个人赶脚:四九、五九才是我们这里温度的最低点。这一周的感受用一句东北话来说就是嘎嘎冷!体感温度近零下30摄氏度:一开车门,好不容易凝聚在身体周遭的“热量”瞬间散失,似乎已经有10多年没有感觉到如此持续的寒冷了。

但巴萨新闻中的一则消息却让作为阿根廷和巴萨双重球迷的我感到了一丝温暖。北京时间本周五凌晨,在巴萨主场与西班牙人队的国王杯四分之一决赛前,梦三主力、巴萨后防中坚小马哥携着自己的家人在巴萨队友的列队欢迎下、在诺坎普主场球迷山呼海啸般的欢呼声中走入诺坎普,和大家做着最后的告别。对于一名职业球员来说,这已经算是在俱乐部层面能得到的最高荣誉了。

虽说梅球王是我的最爱,但小马哥也是我十分喜欢和尊敬的一名足球运动员,在他的身上你几乎能够看到一名职业运动员所有的“正能量”标签:高超的专业能力、职业、自律、低调、坚毅、领导力、热爱足球、热爱家庭、没有绯闻等。对于小马哥这样的功勋球员,以“不只是一家俱乐部(Mes que un club)”为使命的巴萨俱乐部也做出了最大的让步,为小马哥设定了较低的转会费,让他可以按照自己的意愿成功转会到中超的华夏幸福。

小马哥将自己职业生涯中最好的七年奉献给了巴萨,对巴萨的贡献可谓是居功至伟!看看小马哥为巴萨赢得的荣誉吧。

img{512x368}

感谢小马哥,祝福小马哥在后续的职业生涯中一切顺利!在中国生活的快乐!

一、一周文章精粹

1. Hello, 中国!

由于“众所周知”的原因,大陆地区的Gopher们在访问Go官方站点时十分困难。这一定程度上影响了Go在大陆地区的推广。但Go语言在大陆地区的发展势头让Go team看到了建立大陆地区mirror站的必要性。就在这一周,中国的Gopher们迎来了一个Go官方的好消息,那就是Go语言大陆地区官方网站上线了。网站的地址是https://golang.google.cn,这个网站目前就是Go官方站的mirror,很多深层的链接可能依然指向源站,不过迈出第一步总是好的。

文章链接:“Hello,中国!”

2. 尚未修复的逃逸分析缺陷(Escape-Analysis Flaws)

William Kennedy是著名的Go语言培训师,也是《Go in action》这本书的作者之一,他在Ardan Labs网站上撰写了许多篇关于Go语言的学习资料。其中最新的一篇“Escape Analysic Flaws”探讨了当前Go compiler(截至到Go 1.9)中依然存在的逃逸分析的缺陷,包括:

  • Indirect Assignment
  • Indirect Call
  • Slice and Map Assignments
  • Interfaces
  • Unknown

Go实际编码过程中减少在heap上的内存分配是提升性能,减少cost的好方法,通过William的分析,我们也期望能做到尽量避免逃逸的情况,但有些时候做起来很难。因此,让Go compiler自身变得更聪明才是终极解决方法。

文章链接:“Escape-Analysis Flaws”

3. Github用户使用的编程语言排名

国外友人Ben Fredericksont通过对2011以来github的public event数据的分析,得出了关于github上编程语言的使用变化趋势,包括:top ten活跃语言、主流语言的活跃程度变化趋势、2018值得学习的几个热门新语言、几门趋势下降很快的语言、科学计算语言的变化趋势、函数式语言的变化趋势等。

img{512x368}
图:2018值得学习的几个热门新语言

文章链接:“Ranking Programming Languages by GitHub Users”

4. Nonblocking I/O指南

Go语言的默认的网络I/O编程模型是阻塞I/O,这可以大幅降低应用开发者在处理网络I/O时的心智负担。但这也仅限于“用户层面”,研究过Go runtime调度的gopher都知道,在runtime内部,关于网络I/O的调度实际上是Nonblocking的。imgix的工程师Cindy Sridharan曾全面细致总结了对Nonblocking I/O的技术要点的理解,这里推荐给大家。

img{512x368}

文章链接:“Nonblocking I/O”

5. 预测:2018年的最佳Linux发行版

Linux内核已经成为这个星球上使用最为广泛的操作系统内核了,无论是云服务器,还是桌面机,从移动终端到Iot设备,现代人身边10米范围内,一般总能找出一台运行着Linux内核的设备。而对于用户而言,看到的更多是基于Linux内核的各种发行版,比如:Ubuntu、CentOS等。年初JACK WALLEN在linux.com博客上撰文预测了2018年各个领域的最佳Linux发行版,包括从sysadmin、桌面版、server版、便携版、iot版等多个方面。这些预测基于distrowatch.com上各个发行版的人气排名。

文章链接:“best linux distributions for 2018”

6. 如何使用Go语言创建基于AWS Lambda的serverless应用

AWS Lambda宣布支持Go不久,各路关于如何使用Go在AWS Lambda创建serverless应用的资料便接踵踏来。这里推荐的就是其中的一篇。对于想使用Go在AWS Lambda上“尝鲜”的Gopher们,这是个不错的入门文章。

img{512x368}

文章链接:“Serverless Golang API with AWS Lambda”

7. JavaScript框架终极指南

JavaScript这门语言虽然“颜值”不那么高,但这并不妨碍它抱上浏览器这一“大腿”,并还进军了服务端市场。在这一过程中,JavaScript领域诞生了诸多Framework,最出名的莫过于三巨头:AngularReactVue.js这三个框架了。除此之外,还有太多我甚至没有听过名字的框架。这里推荐的“JavaScript框架终极指南”一文就是对JavaScript目前的主流框架的状态、优劣势进行详细总结说明的一篇文章,希望能帮助你挑选出最适合你的Js框架。

img{512x368}

文章链接:“The Ultimate Guide to JavaScript Frameworks”

二、一周资料分享

1. ROSCon 2017资料

ROS作为世界上应用最为广泛、最具影响力的开源机器人操作系统,它从2012年开始举办的ROSCon大会就备受关注,2017年ROSCon大会在加拿大温哥华举行。在人工智能、智能驾驶如此“热”的今天,ROS作为很多智能驾驶平台(比如百度的ApollotierIVautoware等)的底层支撑组件自然吸引了自全世界范围内的学者和工程师的眼球和参与。这次大会的topic是干货满满,由于是ROS2发布正式版前的最后一次大会,因此涉及ROS2的topics十分多,算是为ROS2正式登场预热(注:ROS2在2017.12.10正式发布,代号:Ardent Apalone)。

img{512x368}

资料分享链接:“ROSCon 2017资料”

三、一周工具推荐

1. carbon:一款源码图片创建和分享的工具

在技术文章写作中,我们会有大量的代码截图的需求,但限于客观原因,截图的质量和风格难于把控。Carbon这个工具就是来帮助解决这个问题的。Carbon是一个在线服务,支持通过将源码文件拖拽到生成框中自动生成代码图片。Carbon支持几乎所有主流语言,并可以自动识别,并且Carbon支持多种风格的代码高亮样式,比如:Monokai、Solarized等。

img{512x368}
图:Carbon主页

img{512x368}
图:Carbon生成的Go源码图片

推荐工具链接:Carbon

四、一周图书推荐

1.《Hello World! Second Edition – Computer Programming for Kids and Other Beginners》

都说00后是互联网时代的原住民,那么伴着这轮AI热,我们是否可以大胆地说2020后或2025后是AI时代的原住民呢。这让我仿佛看到了“超能陆战队”中男主小宏所使用的IT装备和掌握的编程技能。也许在未来10年后,编程就会像数学、语文一样成为在AI时代的基本技能。而这一切都要从娃娃抓起,从编程基础抓起。Sande父子合作编写的这本《Hello World》图文并茂地将孩子带入二进制的程序世界,孩子将在轻松惬意的氛围中学习基础的编程概念:如内存、循环、输入和输出、数据结构和图形用户界面等。对于如今智力水平普遍较高的孩子们来说,这些内容就像小游戏般容易掌握。书中使用的教学语言是Python,别忘了目前的Python可是AI时代的top3语言,并是AI第一语言的强有力的竞争者。

很多人说:当前儿童编程的第一语言是MIT的Scratch,我不能否认这一点,Scratch就是为Kids们所创造的,它是MIT继Seymour Papert教授在创建LOGO语言、探索儿童编程教育后的又一杰作。全图形化的编程教学让孩子们很是喜欢。但我个人觉得如果能结合一些真实代码,尤其是对于中高年级的学生来说,将是大有裨益的。

作为Gopher,我一直在想足够简洁的Go语言也是可以作为儿童编程教学语言的,希望能早日出现一门以Go语言为第一教学语言的儿童编程图书。

img{512x368}

图书链接:
《父与子的编程之旅 – 与小卡特一起学Python》
《Hello World! Second Edition – Computer Programming for Kids and Other Beginners》


著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格5$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

我的联系方式:

微博:http://weibo.com/bigwhite20xx
微信公众号:iamtonybai
博客:tonybai.com
github: https://github.com/bigwhite

微信赞赏:
img{512x368}

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

Goroutine调度实例简要分析

前两天一位网友在微博私信我这样一个问题:

抱歉打扰您咨询您一个关于Go的问题:对于goroutine的概念我是明了的,但很疑惑goroutine的调度问题, 根据《Go语言编程》一书:“当一个任务正在执行时,外部没有办法终止它。要进行任务切换,只能通过由该任务自身调用yield()来主动出让CPU使用权。” 那么,假设我的goroutine是一个死循环的话,是否其它goroutine就没有执行的机会呢?我测试的结果是这些goroutine会轮流执行。那么除了syscall时会主动出让cpu时间外,我的死循环goroutine 之间是怎么做到切换的呢?

我在第一时间做了回复。不过由于并不了解具体的细节,我在答复中做了一个假定,即假定这位网友的死循环带中没有调用任何可以交出执行权的代码。事后,这位网友在他的回复后道出了死循环goroutine切换的真实原因:他在死循环中调用了fmt.Println

事后总觉得应该针对这个问题写点什么? 于是就构思了这样一篇文章,旨在循着这位网友的思路通过一些例子来step by step演示如何分析go schedule。如果您对Goroutine的调度完全不了解,那么请先读一读这篇前导文 《也谈goroutine调度器》

一、为何在deadloop的参与下,多个goroutine依旧会轮流执行

我们先来看case1,我们顺着那位网友的思路来构造第一个例子,并回答:“为何在deadloop的参与下,多个goroutine依旧会轮流执行?”这个问题。下面是case1的源码:

//github.com/bigwhite/experiments/go-sched-examples/case1.go
package main

import (
    "fmt"
    "time"
)

func deadloop() {
    for {
    }
}

func main() {
    go deadloop()
    for {
        time.Sleep(time.Second * 1)
        fmt.Println("I got scheduled!")
    }
}

在case1.go中,我们启动了两个goroutine,一个是main goroutine,一个是deadloop goroutine。deadloop goroutine顾名思义,其逻辑是一个死循环;而main goroutine为了展示方便,也用了一个“死循环”,并每隔一秒钟打印一条信息。在我的macbook air上运行这个例子(我的机器是两核四线程的,runtime的NumCPU函数返回4):

$go run case1.go
I got scheduled!
I got scheduled!
I got scheduled!
... ...

从运行结果输出的日志来看,尽管有deadloop goroutine的存在,main goroutine仍然得到了调度。其根本原因在于机器是多核多线程的(硬件线程哦,不是操作系统线程)。Go从1.5版本之后将默认的P的数量改为 = CPU core的数量(实际上还乘以了每个core上硬线程数量),这样case1在启动时创建了不止一个P,我们用一幅图来解释一下:

img{512x368}

我们假设deadloop Goroutine被调度与P1上,P1在M1(对应一个os kernel thread)上运行;而main goroutine被调度到P2上,P2在M2上运行,M2对应另外一个os kernel thread,而os kernel threads在操作系统调度层面被调度到物理的CPU core上运行,而我们有多个core,即便deadloop占满一个core,我们还可以在另外一个cpu core上运行P2上的main goroutine,这也是main goroutine得到调度的原因。

Tips: 在mac os上查看你的硬件cpu core数量和硬件线程总数量:

$sysctl -n machdep.cpu.core_count
2
$sysctl -n machdep.cpu.thread_count
4

二、如何让deadloop goroutine以外的goroutine无法得到调度?

如果我们非要deadloop goroutine以外的goroutine无法得到调度,我们该如何做呢?一种思路:让Go runtime不要启动那么多P,让所有用户级的goroutines在一个P上被调度。

三种办法:

  • 在main函数的最开头处调用runtime.GOMAXPROCS(1);
  • 设置环境变量export GOMAXPROCS=1后再运行程序
  • 找一个单核单线程的机器^0^(现在这样的机器太难找了,只能使用云服务器实现)

我们以第一种方法为例:

//github.com/bigwhite/experiments/go-sched-examples/case2.go
package main

import (
    "fmt"
    "runtime"
    "time"
)

func deadloop() {
    for {
    }
}

func main() {
    runtime.GOMAXPROCS(1)
    go deadloop()
    for {
        time.Sleep(time.Second * 1)
        fmt.Println("I got scheduled!")
    }
}

运行这个程序后,你会发现main goroutine的”I got scheduled”字样再也无法输出了。这里的调度原理可以用下面图示说明:

img{512x368}

deadloop goroutine在P1上被调度,由于deadloop内部逻辑没有给调度器任何抢占的机会,比如:进入runtime.morestack_noctxt。于是即便是sysmon这样的监控goroutine,也仅仅是能给deadloop goroutine的抢占标志位设为true而已。由于deadloop内部没有任何进入调度器代码的机会,Goroutine重新调度始终无法发生。main goroutine只能躺在P1的local queue中徘徊着。

三、反转:如何在GOMAXPROCS=1的情况下,让main goroutine得到调度呢?

我们做个反转:如何在GOMAXPROCS=1的情况下,让main goroutine得到调度呢?听说在Go中 “有函数调用,就有了进入调度器代码的机会”,我们来试验一下是否属实。我们在deadloop goroutine的for-loop逻辑中加上一个函数调用:

// github.com/bigwhite/experiments/go-sched-examples/case3.go
package main

import (
    "fmt"
    "runtime"
    "time"
)

func add(a, b int) int {
    return a + b
}

func deadloop() {
    for {
        add(3, 5)
    }
}

func main() {
    runtime.GOMAXPROCS(1)
    go deadloop()
    for {
        time.Sleep(time.Second * 1)
        fmt.Println("I got scheduled!")
    }
}

我们在deadloop goroutine的for loop中加入了一个add函数调用。我们来运行一下这个程序,看是否能达成我们的目的:

$ go run case3.go

“I got scheduled!”字样依旧没有出现在我们眼前!也就是说main goroutine没有得到调度!为什么呢?其实所谓的“有函数调用,就有了进入调度器代码的机会”,实际上是go compiler在函数的入口处插入了一个runtime的函数调用:runtime.morestack_noctxt。这个函数会检查是否扩容连续栈,并进入抢占调度的逻辑中。一旦所在goroutine被置为可被抢占的,那么抢占调度代码就会剥夺该Goroutine的执行权,将其让给其他goroutine。但是上面代码为什么没有实现这一点呢?我们需要在汇编层次看看go compiler生成的代码是什么样子的。

查看Go程序的汇编代码有许多种方法:

  • 使用objdump工具:objdump -S go-binary
  • 使用gdb disassemble
  • 构建go程序同时生成汇编代码文件:go build -gcflags ‘-S’ xx.go > xx.s 2>&1
  • 将Go代码编译成汇编代码:go tool compile -S xx.go > xx.s
  • 使用go tool工具反编译Go程序:go tool objdump -S go-binary > xx.s

我们这里使用最后一种方法:利用go tool objdump反编译(并结合其他输出的汇编形式):

$go build -o case3 case3.go
$go tool objdump -S case3 > case3.s

打开case3.s,搜索main.add,我们居然找不到这个函数的汇编代码,而main.deadloop的定义如下:

TEXT main.deadloop(SB) github.com/bigwhite/experiments/go-sched-examples/case3.go
        for {
  0x1093a10             ebfe                    JMP main.deadloop(SB)

  0x1093a12             cc                      INT $0x3
  0x1093a13             cc                      INT $0x3
  0x1093a14             cc                      INT $0x3
  0x1093a15             cc                      INT $0x3
   ... ...
  0x1093a1f             cc                      INT $0x3

我们看到deadloop中对add的调用也消失了。这显然是go compiler执行生成代码优化的结果,因为add的调用对deadloop的行为结果没有任何影响。我们关闭优化再来试试:

$go build -gcflags '-N -l' -o case3-unoptimized case3.go
$go tool objdump -S case3-unoptimized > case3-unoptimized.s

打开 case3-unoptimized.s查找main.add,这回我们找到了它:

TEXT main.add(SB) github.com/bigwhite/experiments/go-sched-examples/case3.go
func add(a, b int) int {
  0x1093a10             48c744241800000000      MOVQ $0x0, 0x18(SP)
        return a + b
  0x1093a19             488b442408              MOVQ 0x8(SP), AX
  0x1093a1e             4803442410              ADDQ 0x10(SP), AX
  0x1093a23             4889442418              MOVQ AX, 0x18(SP)
  0x1093a28             c3                      RET

  0x1093a29             cc                      INT $0x3
... ...
  0x1093a2f             cc                      INT $0x3

deadloop中也有了对add的显式调用:

TEXT main.deadloop(SB) github.com/bigwhite/experiments/go-sched-examples/case3.go
  ... ...
  0x1093a51             48c7042403000000        MOVQ $0x3, 0(SP)
  0x1093a59             48c744240805000000      MOVQ $0x5, 0x8(SP)
  0x1093a62             e8a9ffffff              CALL main.add(SB)
        for {
  0x1093a67             eb00                    JMP 0x1093a69
  0x1093a69             ebe4                    JMP 0x1093a4f
... ...

不过我们这个程序中的main goroutine依旧得不到调度,因为在main.add代码中,我们没有发现morestack函数的踪迹,也就是说即便调用了add函数,deadloop也没有机会进入到runtime的调度逻辑中去。

不过,为什么Go compiler没有在main.add函数中插入morestack的调用呢?那是因为add函数位于调用树的leaf(叶子)位置,compiler可以确保其不再有新栈帧生成,不会导致栈分裂或超出现有栈边界,于是就不再插入morestack。而位于morestack中的调度器的抢占式检查也就无法得以执行。下面是go build -gcflags ‘-S’方式输出的case3.go的汇编输出:

"".add STEXT nosplit size=19 args=0x18 locals=0x0
     TEXT    "".add(SB), NOSPLIT, $0-24
     FUNCDATA        $0, gclocals·54241e171da8af6ae173d69da0236748(SB)
     FUNCDATA        $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB)
     MOVQ    "".b+16(SP), AX
     MOVQ    "".a+8(SP), CX
     ADDQ    CX, AX
     MOVQ    AX, "".~r2+24(SP)
    RET

我们看到nosplit字样,这就说明add使用的栈是固定大小,不会再split,且size为24字节。

关于在for loop中的leaf function是否应该插入morestack目前还有一定争议,将来也许会对这样的情况做特殊处理。

既然明白了原理,我们就在deadloop和add之间加入一个dummy函数,见下面case4.go代码:

//github.com/bigwhite/experiments/go-sched-examples/case4.go
package main

import (
    "fmt"
    "runtime"
    "time"
)

//go:noinline
func add(a, b int) int {
    return a + b
}

func dummy() {
    add(3, 5)
}

func deadloop() {
    for {
        dummy()
    }
}

func main() {
    runtime.GOMAXPROCS(1)
    go deadloop()
    for {
        time.Sleep(time.Second * 1)
        fmt.Println("I got scheduled!")
    }
}

执行该代码:

$go run case4.go
I got scheduled!
I got scheduled!
I got scheduled!

Wow! main goroutine果然得到了调度。我们再来看看go compiler为程序生成的汇编代码:

$go build -gcflags '-N -l' -o case4 case4.go
$go tool objdump -S case4 > case4.s

TEXT main.add(SB) github.com/bigwhite/experiments/go-sched-examples/case4.go
func add(a, b int) int {
  0x1093a10             48c744241800000000      MOVQ $0x0, 0x18(SP)
        return a + b
  0x1093a19             488b442408              MOVQ 0x8(SP), AX
  0x1093a1e             4803442410              ADDQ 0x10(SP), AX
  0x1093a23             4889442418              MOVQ AX, 0x18(SP)
  0x1093a28             c3                      RET

  0x1093a29             cc                      INT $0x3
  0x1093a2a             cc                      INT $0x3
... ...

TEXT main.dummy(SB) github.com/bigwhite/experiments/go-sched-examples/case4.s
func dummy() {
  0x1093a30             65488b0c25a0080000      MOVQ GS:0x8a0, CX
  0x1093a39             483b6110                CMPQ 0x10(CX), SP
  0x1093a3d             762e                    JBE 0x1093a6d
  0x1093a3f             4883ec20                SUBQ $0x20, SP
  0x1093a43             48896c2418              MOVQ BP, 0x18(SP)
  0x1093a48             488d6c2418              LEAQ 0x18(SP), BP
        add(3, 5)
  0x1093a4d             48c7042403000000        MOVQ $0x3, 0(SP)
  0x1093a55             48c744240805000000      MOVQ $0x5, 0x8(SP)
  0x1093a5e             e8adffffff              CALL main.add(SB)
}
  0x1093a63             488b6c2418              MOVQ 0x18(SP), BP
  0x1093a68             4883c420                ADDQ $0x20, SP
  0x1093a6c             c3                      RET

  0x1093a6d             e86eacfbff              CALL runtime.morestack_noctxt(SB)
  0x1093a72             ebbc                    JMP main.dummy(SB)

  0x1093a74             cc                      INT $0x3
  0x1093a75             cc                      INT $0x3
  0x1093a76             cc                      INT $0x3
.... ....

我们看到main.add函数依旧是leaf,没有morestack插入;但在新增的dummy函数中我们看到了CALL runtime.morestack_noctxt(SB)的身影。

四、为何runtime.morestack_noctxt(SB)放到了RET后面?

在传统印象中,morestack是放在函数入口处的。但实际编译出来的汇编代码中(见上面函数dummy的汇编),runtime.morestack_noctxt(SB)却放在了RET的后面。解释这个问题,我们最好来看一下另外一种形式的汇编输出(go build -gcflags ‘-S’方式输出的格式):

"".dummy STEXT size=68 args=0x0 locals=0x20
        0x0000 00000 TEXT    "".dummy(SB), $32-0
        0x0000 00000 MOVQ    (TLS), CX
        0x0009 00009 CMPQ    SP, 16(CX)
        0x000d 00013 JLS     61
        0x000f 00015 SUBQ    $32, SP
        0x0013 00019 MOVQ    BP, 24(SP)
        0x0018 00024 LEAQ    24(SP), BP
        ... ...
        0x001d 00029 MOVQ    $3, (SP)
        0x0025 00037 MOVQ    $5, 8(SP)
        0x002e 00046 PCDATA  $0, $0
        0x002e 00046 CALL    "".add(SB)
        0x0033 00051 MOVQ    24(SP), BP
        0x0038 00056 ADDQ    $32, SP
        0x003c 00060 RET
        0x003d 00061 NOP
        0x003d 00061 PCDATA  $0, $-1
        0x003d 00061 CALL    runtime.morestack_noctxt(SB)
        0x0042 00066 JMP     0

我们看到在函数入口处,compiler插入三行汇编:

        0x0000 00000 MOVQ    (TLS), CX  // 将TLS的值(GS:0x8a0)放入CX寄存器
        0x0009 00009 CMPQ    SP, 16(CX)  //比较SP与CX+16的值
        0x000d 00013 JLS     61 // 如果SP > CX + 16,则jump到61这个位置

这种形式输出的是标准Plan9的汇编语法,资料很少(比如JLS跳转指令的含义),注释也是大致猜测的。如果跳转,则进入到 runtime.morestack_noctxt,从 runtime.morestack_noctxt返回后,再次jmp到开头执行。

为什么要这么做呢?按照go team的说法,是为了更好的利用现代CPU的“static branch prediction”,提升执行性能。

五、参考资料

文中的代码可以点击这里下载。


微博:@tonybai_cn
微信公众号:iamtonybai
github.com: https://github.com/bigwhite

微信赞赏:
img{512x368}

欢迎使用邮件订阅我的博客

输入邮箱订阅本站,只要有新文章发布,就会第一时间发送邮件通知你哦!




这里是Tony Bai的个人Blog,欢迎访问、订阅和留言!订阅Feed请点击上面图片

如果您觉得这里的文章对您有帮助,请扫描上方二维码进行捐赠,加油后的Tony Bai将会为您呈现更多精彩的文章,谢谢!

如果您希望通过微信捐赠,请用微信客户端扫描下方赞赏码:


如果您希望通过比特币或以太币捐赠,可以扫描下方二维码:

比特币:


以太币:


如果您喜欢通过微信App浏览本站内容,可以扫描下方二维码,订阅本站官方微信订阅号“iamtonybai”;点击二维码,可直达本人官方微博主页^_^:



本站Powered by Digital Ocean VPS。

选择Digital Ocean VPS主机,即可获得10美元现金充值,可免费使用两个月哟!

著名主机提供商Linode 10$优惠码:linode10,在这里注册即可免费获得。

阿里云推荐码:1WFZ0V立享9折!

View Tony Bai's profile on LinkedIn


文章

评论

  • 正在加载...

分类

标签

归档











更多