TensorFlow实战：CSV文件数据读取与解析

105 浏览量更新于2024-08-29 收藏 44KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

在TensorFlow中，读取CSV数据是训练机器学习模型的基础步骤，特别是在处理结构化数据时。本文主要讲解如何使用TensorFlow的内置函数来从CSV文件中读取数据。CSV（Comma Separated Values）是一种常见的数据存储格式，它用逗号分隔字段，便于数据分析工具进行处理。首先，我们介绍一个简单的实例，用于详细解析CSV文件`tf_read.csv`。在这个例子中，我们假设CSV文件包含四列数据，每列数据都是浮点数，用逗号分隔。以下是关键步骤： 1. 导入所需的库：`import tensorflow as tf`，这是使用TensorFlow的基础。 2. 创建`filename_queue`：`filename_queue = tf.train.string_input_producer(["/home/yongcai/tf_read.csv"])`，这是创建一个字符串队列，用于指定CSV文件的位置。 3. 使用`TextLineReader`：`reader = tf.TextLineReader()`，这是一个TensorFlow内置的文本行读取器，负责读取文件中的每一行。 4. 读取数据：`key, value = reader.read(filename_queue)`，`key`存储的是当前读取的行的索引，`value`存储的是该行的实际数据。 5. 定义默认值：`record_defaults = [[1.], [1.], [1.], [1.]]`，这个列表定义了数据列的默认值，如果CSV文件中某列的数据缺失，就会使用这些默认值进行填充。 6. 解码CSV数据：`col1,col2,col3,col4 = tf.decode_csv(value, record_defaults=record_defaults)`，将读取到的文本数据转换成浮点数数组，对应文件中的各个字段。 7. 创建特征向量：`features = tf.stack([col1, col2, col3])`，将前三个列组合成一个三维张量，作为输入特征。 8. 初始化操作：`init_op = tf.global_variables_initializer()` 和 `local_init_op = tf.local_variables_initializer()`，设置变量初始化的操作。 9. 会话和控制：在`with tf.Session() as sess:`块中运行初始化操作，并启动线程以填充队列。`coord = tf.train.Coordinator()`和`threads = tf.train.start_queue_runners(coord=coord)`用于协调多线程执行。 10. 主循环：通过`for i in range(30):`读取30个样本，每次迭代获取特征向量`example`和对应的标签`label`。 11. 文件遍历：当文件中的所有数据都被读取完毕后，`tf.errors.OutOfRangeError`会被抛出，程序进入`except`块打印`Done!!!`。 12. 善后工作：最后关闭线程和协调器。在给出的CSV数据部分，可以看到数据格式为每行四个浮点数，表示四列数值。例如，第一行数据`-0.76, 1.67, -0.12, 1.67`展示了四列的值。通过上述代码，我们可以有效地从CSV文件中提取数据并用于训练或评估机器学习模型。注意，实际应用中可能需要根据具体数据调整字段数、类型等细节。

资源详情

资源推荐

TensorFlow 读取读取CSV数据的实例数据的实例

TensorFlow 读取CSV数据原理在此就不做详细介绍，直接通过代码实现：

方法一：方法一：

详细读取详细读取tf_read.csv 代码代码

#coding:utf-8

import tensorflow as tf

filename_queue = tf.train.string_input_producer(["/home/yongcai/tf_read.csv"])

reader = tf.TextLineReader()

key, value = reader.read(filename_queue)

record_defaults = [[1.], [1.], [1.], [1.]] col1, col2, col3, col4 = tf.decode_csv(value, record_defaults=record_defaults)

features = tf.stack([col1, col2, col3])

init_op = tf.global_variables_initializer()

local_init_op = tf.local_variables_initializer()

with tf.Session() as sess:

sess.run(init_op)

sess.run(local_init_op)

# Start populating the filename queue.

coord = tf.train.Coordinator()

threads = tf.train.start_queue_runners(coord=coord)

try:

for i in range(30):

example, label = sess.run([features, col4])

print(example)

# print(label)

except tf.errors.OutOfRangeError:

print 'Done !!!'

finally:

coord.request_stop()

coord.join(threads)

tf_read.csv 数据：数据：

-0.76 15.67 -0.12 15.67

-0.48 12.52 -0.06 12.51

1.33 9.11 0.12 9.1

-0.88 20.35 -0.18 20.36

-0.25 3.99 -0.01 3.99

-0.87 26.25 -0.23 26.25

-1.03 2.87 -0.03 2.87

-0.51 7.81 -0.04 7.81

-1.57 14.46 -0.23 14.46

-0.1 10.02 -0.01 10.02

-0.56 8.92 -0.05 8.92

-1.2 4.1 -0.05 4.1

-0.77 5.15 -0.04 5.15

-0.88 4.48 -0.04 4.48

-2.7 10.82 -0.3 10.82

-1.23 2.4 -0.03 2.4

-0.77 5.16 -0.04 5.15

-0.81 6.15 -0.05 6.15

-0.6 5.01 -0.03 5

-1.25 4.75 -0.06 4.75

-2.53 7.31 -0.19 7.3

-1.15 16.39 -0.19 16.39

-1.7 5.19 -0.09 5.18

-0.62 3.23 -0.02 3.22

-0.74 17.43 -0.13 17.41

-0.77 15.41 -0.12 15.41

0 47 0 47.01

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38677190

粉丝: 6
资源: 891

TensorFlow实战：CSV文件数据读取与解析

Tensorflow分批量读取数据教程

如何从csv文件构建Tensorflow的数据集

tensorflow读取csv文件及搭建神经网络训练

写一个tensorflow读取csv文件的代码

写一个tensorflow读取csv文件并导入神经网络的代码

写一个tensorflow读取csv文件及搭建神经网络训练的代码

tensorflow读取csv文件并导入神经网络训练然后输出损失函数值

tensorflow1读取csv文件

tensorflow读取图像数据

tensorflow读取数据集

tensorflow从csv读取数据，输入32位参数，输出2位参数代码

tensorflow从csv读取数据，输入32位参数，输出2位参数，并构建神经网络，训练保存该模型，然后用该模型进行预测代码

tensorflow读取图片数据类型

用tensorflow读取 MNIST 数据集

tensorflow2.0 csv文件

tensorflow读取mnist数据集

TensorFlow读取后缀名为csv的文件中的smiles号并画成结构式批量打印到屏幕。

c++ 读取csv数据

numpy 读取csv数据

r语言读取csv数据的多种方法是？

最新资源