June
23rd,
2018
系统概述

TensorFlow的系统结构以C API
为界,将整个系统分为前端和后端两个子系统:
- 前端:提供编程模型,构造计算图
- 后端:提供运行时环境,执行计算图
4个基本组件:
client
:通过Session
为桥梁,连接TensorFlow后端,并启动计算图的执行过程。Master
:- 在分布式的运行时环境中,
Master
根据Session.run
的Fetching
参数,从计算图找到所依赖的最小子图; - 将该子图再次分裂为多个子图片段,以便在不同的进程和设备上运行这些子图片段;
- 将这些子图片段派发给
Worker
; Worker
启动子图片段的执行过程。
- 在分布式的运行时环境中,
Worker
:- 按照计算图中节点的依赖关系,调用
Kernel
实现完成运算。 - 负责将运算的结果与其他
Worker
交互。
- 按照计算图中节点的依赖关系,调用
Kernel Implements
:执行OP运算。

一种划分子图片段的方法,通过SEND、RECV节点传输数据。