Yarn笔记：Container启动流程

2018-11-26

上次介绍了源码|Yarn的事件驱动模型与状态机，今天看个小例子——Container启动流程，巩固对Yarn分布式模型和事件驱动并发模型的理解。

值得庆幸的是，尽管状态机模型设计复杂，但一旦设计（最好能证明）完成，就自然的解决了很多分布式和并发上的一致性问题，因此，对Yarn源码的学习不会像HDFS一样冗长枯燥，往往顺着状态机看几个关键流程即可。

源码版本：Apache Hadoop 2.6.0

一、RM上的过程：准备Container

RMContainer

收到AM的心跳请求，立即响应。
根据资源和负载选择NM（两种资源策略？？？）。
创建RMContainer状态机，NEW状态。
发送START事件，转到ALLOCATED状态（表示该container已被分配，但未通知AM）。
在下一次AM心跳响应中返回已分配的container（即，异步分配）。
发送ACQUIRED事件，转到ACQUIRED状态（表示该container已通知AM）。

二、AM上的过程：拿到Container，通知NM启动

收到心跳响应中的已分配container。
通知NM启动该container。

三、NM上的过程：实际启动Container

NMContainer

NM上的Container、资源等也有类似状态转换过程，以下描述忽略。

NM收到AM的启动指令。
创建Container状态机、初始化资源等（资源也通过状态机管理）。
ContainerLaucher服务收到LAUNCH_CONTAINER事件。
将待运行container所需的环境变量、运行命令等写入launch_container.sh脚本。
启动ContainerMonitor，监控container的内存资源（超过配额就kill。CPU配合通过cgroup控制。）。
将启动launch_container.sh脚本的命令写入container_executor.sh脚本（防止变量展开、特殊符号转义等）。
启动container_executor.sh脚本。
在NM->RM的心跳请求中异步汇报已启动的container。

四、回到RM：首尾

收到NM心跳中的汇报。
向RMContainer状态机发送LAUNCHED事件，转到RUNNING状态。

扫描微信关注我

微信公众号二维码

本文链接：Yarn笔记：Container启动流程
作者：猴子007
出处：https://monkeysayhi.github.io
本文基于知识共享署名-相同方式共享 4.0 国际许可协议发布，欢迎转载，演绎或用于商业目的，但是必须保留本文的署名及链接。

全部
标签
友链
我

简书掘金 Jane_s_blog All_is_well

我是猴子007，<br>一只非常特殊的动物，<br>可以从事程序的开发、维护，<br>经常因寻找香蕉或母猿而无心工作。