我有一个表示为NumPy形状矩阵的数据集(num_features, num_examples),我希望将其转换为TensorFlow类型tf.Dataset。
(num_features, num_examples)
tf.Dataset
我正在努力尝试理解这两种方法之间的区别:Dataset.from_tensors和Dataset.from_tensor_slices。什么是正确的,为什么?
Dataset.from_tensors
Dataset.from_tensor_slices
TensorFlow文档(link)表示,这两种方法都接受张量的嵌套结构,尽管使用from_tensor_slices张量时在第0维上应具有相同的大小。
from_tensor_slices
from_tensors 合并输入并返回具有单个元素的数据集:
from_tensors
t = tf.constant([[1, 2], [3, 4]]) ds = tf.data.Dataset.from_tensors(t) # [[1, 2], [3, 4]]
from_tensor_slices 为输入张量的每一行创建一个具有单独元素的数据集:
t = tf.constant([[1, 2], [3, 4]]) ds = tf.data.Dataset.from_tensor_slices(t) # [1, 2], [3, 4]