在TensorFlow示例中,我可以看到下载数据集csv格式的URL。例如,
虹膜-https://storage.googleapis.com/download.tensorflow.org/data/iris_training.csv
泰坦尼克号https://storage.googleapis.com/tf-datasets/titanic/train.csv
然而,我找不到TensorFlow中列出的每个数据集的URL。(https://www.tensorflow.org/datasets/catalog/overview)。
您不需要URL。Tensorflow数据集已经可以使用了。查看这里的教程tfds指南
对于titanic,它在这里可用titanic结构化数据集
希望这会有所帮助:(
TensorFlow数据集有一组现成的数据集。从tfds-";数据集已下载并准备到/root/tensorflow_datasets/iris/2.0.0后续调用将重用此数据"-真的很新奇。。。但如果您最好从url获取数据集(请参阅此处-管道很方便(:
# https://www.tensorflow.org/guide/data#consuming_csv_data
import tensorflow as tf
import pandas as pd
# test_file = tf.keras.utils.get_file("temperature.csv", "https://raw.githubusercontent.com/jbrownlee/Datasets/master/daily-min-temperatures.csv")
titanic_file = tf.keras.utils.get_file("train.csv", "https://storage.googleapis.com/tf-datasets/titanic/train.csv")
df = pd.read_csv(titanic_file)
df.head()
# make dataset from pandas:
myDataset = tf.data.Dataset.from_tensor_slices(dict(df))
for feature_batch in myDataset.take(1):
for key, value in feature_batch.items():
print(" {!r:20s}: {}".format(key, value))
titanic_lines = tf.data.TextLineDataset(titanic_file)
for line in titanic_lines.take(10):
print(line.numpy())
这里有不同的数据集&流量也是