TensorFlow数据供给与边缘计算入门

需积分: 45 199 浏览量更新于2024-08-07 收藏 3.91MB PDF 举报

"该文档是2018版关于边缘计算和AI边缘计算的白皮书，其中重点讨论了数据读取在TensorFlow程序中的三种方法：供给数据、从文件读取数据和预加载数据。内容包括供给数据的机制，如何通过feed_dict向运算图注入数据，以及使用placeholder的操作。此外，文件还提到了数据读取的其他方面，如文件名乱序、批处理、序列化输入数据等，并简要介绍了TensorFlow的基础知识，如计算图、张量、变量、取回和供给的使用。" 本文档详细阐述了TensorFlow中数据读取的关键概念和操作方法，对于理解和实践深度学习和人工智能项目至关重要。首先，介绍了供给数据（Feeding）的方式，这是通过Python代码在每一步运算中直接向TensorFlow图提供数据的方法。这通常通过在`run()`或`eval()`函数中使用`feed_dict`参数实现，使Python运算能将数据设置到图中的张量。其次，文件读取数据是另一种常用策略，特别是在数据量较大的情况下。这通常涉及在TensorFlow图的起始阶段创建输入管线来读取文件。文件可能包含多种格式，如TFRecords或CSV，需要进行适当的预处理，以便模型能够正确解析和理解。文件名乱序和最大训练迭代数（epoch limits）是控制数据读取流程的重要因素，有助于模型的随机性和防止过拟合。此外，文档还提到批处理（batching），这是一种常见的优化技术，通过一次处理多个样本来提高训练效率。预读线程（QueueRunner）的创建可以预先加载数据，确保数据流的连续性，避免因数据加载延迟导致的训练停滞。预加载数据适用于数据量较小的情况，通过在图中定义常量或变量来存储全部数据。而多管线输入则允许并行处理来自多个数据源的数据，增加系统的吞吐量。文件还涵盖了序列化输入数据（Sparse input data）的处理，这对于处理稀疏数据特别有用。同时，文档提到可以对记录进行过滤，或者为每个记录创建多个样本，以适应不同的训练需求。最后，文档提供了TensorFlow的基本使用指南，包括起步、安装、基本使用以及通过MNIST数据集进行机器学习入门的实例，展示了如何构建和训练简单的模型，以及如何进行模型评估，这对于初学者来说是非常有价值的参考资料。

菊果子

粉丝: 50

TensorFlow数据供给与边缘计算入门

边缘计算参考架构3.0 白皮书.pdf

边缘计算参考框架3.0(2018年)

边缘计算参考架构3.0(2018年)

lmbench-3.0

rddata.m -- MIT-BIH ECG 信号的数据读取Matlab程序

Hibernate 离线的配置方法(hibernate-mapping-3.0.dtd)

自定义数据读取：TensorFlow中的边缘计算与文件格式操作

MODIS NDVI 2000-2018年1公里分辨率数据集

2014-2018年全国城市空气质量数据集及城市省份映射

5G边缘计算安全白皮书：通信行业的安全指南

最新资源