TensorFlow入门教程：从基础到分布式

需积分: 17 153 浏览量更新于2024-07-17 收藏 5.18MB PDF 举报

"TensorFlow基础教程，包括基础概念、线性模型、学习机制和分布式训练的介绍。" 在TensorFlow中，基础部分主要涵盖以下几个关键概念： 1. 变量（Variables） TensorFlow中的变量用于存储可变数据，比如模型参数。它们在计算图中扮演着持久化状态的角色。在上面的示例中，`tf.constant(35,name='x')` 创建了一个不可变的常量`x`，而`tf.Variable(x+5,name='y')` 创建了一个可变的变量`y`，其初始值为`x`加上5。在实际运行时，变量需要通过会话（Session）进行初始化，如`tf.global_variables_initializer().run()`。 2. 计算图（Computational Graph） TensorFlow的工作方式是先构建计算图，然后在会话中执行。这种延迟执行模式允许高效地组织复杂的计算，并且支持分布式执行。 3. 操作（Operations）在TensorFlow中，每个计算都是一个操作，如加法（`+`）、乘法（`*`）等。这些操作连接起来形成计算图，定义了数据流。 4. 张量（Tensors）张量是TensorFlow中的基本数据结构，可以是标量、向量、矩阵或其他高维数组。张量可以是常量、变量或由其他操作产生的输出。 5. 会话（Session）会话负责执行计算图中的操作，实际执行计算并返回结果。例如，`with tf.Session() as sess:` 内的代码会执行图中的计算。接下来，教程深入到线性模型部分：线性模型是一种简单的机器学习模型，通常用于回归问题。在TensorFlow中，线性模型可以通过以下步骤构建： 1. 定义输入特征（`x`）和目标变量（`y`）。 2. 创建权重变量（`w`）和偏置变量（`b`）。 3. 定义模型预测（`y_pred = w * x + b`）。 4. 定义损失函数（如均方误差）。 5. 使用梯度下降或其他优化器更新权重和偏置以最小化损失。 6. 训练模型并评估其性能。学习部分则涉及到学习过程，包括： 1. 损失函数（Loss Function）用于衡量模型预测与实际结果之间的差距，例如均方误差或交叉熵。 2. 优化器（Optimizer）如梯度下降、随机梯度下降（SGD）、Adam等，它们用于更新模型参数以减小损失。 3. 训练循环（Training Loop）在训练数据集上迭代，每个周期执行一次前向传播、计算损失、反向传播和参数更新。最后，分布式部分讨论如何利用多台机器或多个GPU进行分布式训练： 1. 分布式策略（Distributed Strategies）如MirroredStrategy、MultiWorkerMirroredStrategy等，它们协调多个设备上的计算，实现模型并行训练。 2. 工作节点（Workers）处理数据和模型更新的节点。 3. 参数服务器（Parameter Server）负责存储和同步模型参数的节点。 4. 通信库（如GRPC）支持跨节点通信，交换梯度和其他模型信息。这个基础教程旨在引导初学者理解TensorFlow的核心概念，从构建简单的计算图到实现复杂的机器学习模型，以及如何在多设备环境中扩展计算。通过学习这个教程，读者将具备使用TensorFlow解决实际问题的能力。

importtensorflowastf

x=tf.placeholder("float",None)

y=x*2

withtf.Session()assession:

result=session.run(y,feed_dict={x:[1,2,3]})

print(result)

这个例子与我们之前的例子略有不同，让我们分解它。

首先，我们正常导入 tensorflow。然后我们创建一个名

为 x的 placeholder，即我们稍后将存储值的内存中的位置。

然后，我们创建一个 Tensor，它是 x乘以2的运算。注意我们还没有为 x定

义任何初始值。

我们现在定义了一个操作（ y），现在可以在会话中运行它。我们创建一个会话

对象，然后只运行 y变量。请注意，这意味着，如果我们定义了更大的操作图，

我们只能运行图的一小部分。这个子图求值实际上是TensorFlow的一个卖点，而

且许多其他类似的东西都没有。

运行 y需要了解 x的值。我们在 feed_dict参数中定义这些来运行。我们在这

里声明 x的值是 [1,2,3]。我们运行 y，给了我们结果 [2,4,6]。

占位符不需要静态大小。让我们更新我们的程序，让 x可以接受任何长度。

将 x的定义更改为：

x=tf.placeholder("float",None)

现在，当我们在 feed_dict中定义 x的值时，我们可以有任意维度的值。代码

应该仍然有效，并给出相同的答案，但现在它也可以处理 feed_dict中的任意维

度的值。

占位符也可以有多个维度，允许存储数组。在下面的示例中，我们创建一个3乘2

的矩阵，并在其中存储一些数字。然后，我们使用与以前相同的操作，来逐元素加

倍数字。

一、基础

单击 New（新建），然后单击 Notebooks（笔记本）下的 Python3（Python

3）。这将启动一个新的浏览器选项卡。通过单击顶部的 Untitled（无标题）为

该笔记本命名，并为其命名（我使用 InteractiveTensorFlow）。

如果你以前从未使用过Jupyter笔记本（或IPython笔记本），请查看此站点

来获得简介。

接下来，和以前一样，让我们创建一个基本的TensorFlow程序。一个主要的变化

是使用 InteractiveSession，它允许我们运行变量，而不需要经常引用会话对

象（减少输入！）。下面的代码块分为不同的单元格。如果你看到代码中断，则

需要先运行上一个单元格。此外，如果你不自信，请确保在运行之前将给定块中的

所有代码键入单元格。

importtensorflowastf

session=tf.InteractiveSession()

x=tf.constant(list(range(10)))

在这段代码中，我们创建了一个 InteractiveSession，然后定义一个常量值，

就像一个占位符，但具有设置的值（不会改变）。在下一个单元格中，我们可以求

解此常量并打印结果。

print(x.eval())

下面我们关闭打开的会话。

session.close()

关闭会话非常重要，并且很容易忘记。出于这个原因，我们在之前的教程中使

用 with关键字来处理这个问题。当 with块完成执行时，会话将被关闭（如果

发生错误也会发生这种情况-会话仍然关闭）。

现在让我们来看更大的例子。在这个例子中，我们将使用一个非常大的矩阵并对其

进行计算，跟踪何时使用内存。首先，让我们看看我们的Python会话当前使用了

多少内存：

importresource

print("{}Kb".format(resource.getrusage(resource.RUSAGE_SELF).ru

_maxrss))

在我的系统上，运行上面的代码之后，使用了78496千字节。现在，创建一个新

会话，并定义两个矩阵：

一、基础

剩余87页未读，继续阅读

枫林度

粉丝: 0

TensorFlow入门教程：从基础到分布式

TensorFlow基础教程01

tensorflow基础教程中所用mnist数据集

斯坦福tensorflow 基础教程 适合入门

TensorFlow 基础教程简介.docx

TensorFlow基础教程：Python实验操作指南

全面掌握Tensorflow基础教程与资源集锦

Python机器学习教程《TensorFlow基础教程》课程资料

TensorFlow基础教程：掌握CSV文件读取技巧

TensorFlow基础教程：从入门到深度学习

TensorFlow基础教程第5章：掌握张量与基础运算

最新资源

斯坦福tensorflow 基础教程适合入门