TensorFlow稀疏张量详解：高效处理多维稀疏数据

73 浏览量更新于2024-08-31 收藏 203KB PDF 举报

在TensorFlow中，稀疏张量是一种高效的数据结构，用于表示多维数据中的非密集模式。对于处理大量稀疏数据时，如自然语言处理中的词汇表或者图像数据中的像素分布，传统的密集矩阵会占用大量内存，而稀疏张量则能更有效地节省空间。TensorFlow提供了`tf.SparseTensor`类来支持这种表示。 `tf.SparseTensor`的核心构造方法是通过三个参数：`indices`，`values`和`dense_shape`。`indices`是一个(n, ndims)的二维整数张量，其中n表示非零元素的数量，ndims是稀疏张量的维度。这些索引标识了哪些元素是实际存在的，而非零元素的位置。例如，`indices=[[1,3],[2,4]]`意味着在二维张量中，第一行第三列和第二行第四列的元素是不为零的。 `values`是一个一维张量，其长度与`indices`的第二个维度相同，它存储的是对应于`indices`中指定位置的非零元素的实际数值。例如，如果`indices`中有两个非零元素，`values`就是一个包含这两个元素值的列表。 `dense_shape`是一个一维张量，表示稀疏张量在内存中占据的完整维度，即使大部分位置是空的。这个参数确保了在处理张量时，可以正确地理解其形状，即便它实际上非常稀疏。在实际操作中，我们可以利用`tf.sparse_to_dense`函数将稀疏张量转换为普通的稠密矩阵。这个函数需要输入`sparse_indices`（非零元素的位置）、`output_shape`（目标矩阵的维度）、`sparse_values`（对应位置的元素值）以及`default_value`（填充未指定位置的默认值，通常为0）。例如，`tf.sparse_to_dense(mysparse_indices=[5], [11], 10)`会创建一个11x11的矩阵，其中在索引5的位置填充10，其他位置为默认值0。在TensorFlow中，通过合理的使用`tf.SparseTensor`和相关的转换函数，可以优化模型的内存使用，并提高处理大规模稀疏数据的效率。这在深度学习、推荐系统等场景中尤其重要，可以帮助我们构建更为高效和精确的模型。

浅谈浅谈TensorFlow之稀疏张量表示之稀疏张量表示

对于多维的稀疏数据，TensorFlow 支持 SparseTensor 表示。

官方文档地址：https://tensorflow.google.cn/api_guides/python/sparse_ops

构造稀疏张量构造稀疏张量

SparseTensor(indices, values, dense_shape)

indices是一个维度为(n, ndims)的2-D int64张量，指定非零元素的位置。比如indices=[[1,3], [2,4]]表示[1,3]和[2,4]位置的元素

为非零元素。n表示非零元素的个数，ndims表示构造的稀疏张量的维数。

values是一个维度为(N)的1-D张量，对应indices所指位置的元素值。

dense_shape是一个维度为(ndims)的1-D张量，代表稀疏张量的维度。

tf.SparseTensor(indices=[[0, 0], [1, 2]], values=[1, 2], dense_shape=[3, 4])

[[1, 0, 0, 0] [0, 0, 2, 0] [0, 0, 0, 0]]

转换转换

将稀疏张量转为普通矩阵。

tf.sparse_to_dense(

sparse_indices,

output_shape,

sparse_values,

default_value=0,

validate_indices=True,

name=None

)

sparse_indices是那些非零元素的位置。

sparse_indices是实数，该矩阵为一维矩阵，指定一维矩阵的某一个元素位置

sparse_indices是向量，该矩阵为一维矩阵，指定一维矩阵的多个元素

sparse_indices是二维矩阵，该矩阵为多维矩阵，指定多维矩阵的多个元素。

output_shape是矩阵的维度。

sparse_value是对应sparse_indices所指位置的元素值。

default_value是未指定元素的默认值，一般为0。

import tensorflow as tf

mysparse_indices = tf.constant(5)

mymatrix = tf.sparse_to_dense(mysparse_indices, [11], 10)

with tf.Session() as sess:

result = sess.run(mymatrix)

print(result)

//[0 0 0 0 0 10 0 0 0 0 0]

SparseTensor和和SparseTensorValue

两者的参数相同。

在计算图中定义稀疏张量时，使用SparseTensor；在feed数据时使用SparseTensorValue。

补充知识：补充知识：彻底搞懂彻底搞懂tensorflow里的张量里的张量(tensor)

1.引言引言

学习卷积神经网络(CNN)的时候，最重要的就是搞清楚网络各层的神经元输入输出的数据结构(即张量)。如果仅用线性代数所

学的矩阵，向量来理解张量，一定会搞得一头雾水。因此很有必要搞清楚张量是什么东西。

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38738189

粉丝: 5
资源: 954

TensorFlow稀疏张量详解：高效处理多维稀疏数据

浅谈tensorflow中张量的提取值和赋值

在TensorFlow中实现张量分解_python

深度学习技术（tensorflow框架，张量与变量）【beta版】

tensorflow实现稀疏张量转化为稠密张量

tensorflow 张量内积

tensorflow2.0版本张量求逆

tensorflow怎么得到张量的大小

在tensorflow网络中张量如何保存

TensorFlow和PyTorch的张量类型如何转换

tensorflow里面把张量转换成元素

最新资源