如何获取URL来下载Tensorflow数据集的csv文件

在TensorFlow示例中，我可以看到下载数据集csv格式的URL。例如，

虹膜-https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv

泰坦尼克号https://storage.googleapis.com/tf-datasets/titanic/train.csv

然而，我找不到TensorFlow中列出的每个数据集的URL。(https://www.tensorflow.org/datasets/catalog/overview)。

您不需要URL。Tensorflow数据集已经可以使用了。查看这里的教程tfds指南

对于titanic，它在这里可用titanic结构化数据集

希望这会有所帮助：(

TensorFlow数据集有一组现成的数据集。从tfds-"；数据集已下载并准备到/root/tensorflow_datasets/iris/2.0.0后续调用将重用此数据"-真的很新奇。。。但如果您最好从url获取数据集(请参阅此处-管道很方便(：

# https://www.tensorflow.org/guide/data#consuming_csv_data
import tensorflow as tf
import pandas as pd
# test_file = tf.keras.utils.get_file("temperature.csv", "https://raw.githubusercontent.com/jbrownlee/Datasets/master/daily-min-temperatures.csv")
titanic_file = tf.keras.utils.get_file("train.csv", "https://storage.googleapis.com/tf-datasets/titanic/train.csv")
df = pd.read_csv(titanic_file)
df.head()
# make dataset from pandas:
myDataset = tf.data.Dataset.from_tensor_slices(dict(df))
for feature_batch in myDataset.take(1):
for key, value in feature_batch.items():
print("  {!r:20s}: {}".format(key, value))
titanic_lines = tf.data.TextLineDataset(titanic_file)
for line in titanic_lines.take(10):
print(line.numpy())

这里有不同的数据集&流量也是

相关内容

最新更新

热门标签：