从Kaggle读取数据集

我想从kaggle下载一个数据集，链接是:https://www.kaggle.com/datasets/birdy654/cifake-real-and-ai-generated-synthetic-images在这个链接中有一个下载按钮。它的链接是:https://www.kaggle.com/datasets/birdy654/cifake-real-and-ai-generated-synthetic-images/download?datasetVersionNumber=3我的本地机器上有一个Jupyter项目。当我尝试使用

下载数据集时:

url = 'https://www.kaggle.com/datasets/birdy654/cifake-real-and-ai-generated-synthetic-images/download?datasetVersionNumber=3'
response = requests.get(url)
with open('cifake-real-and-ai-generated-synthetic-images.zip', 'wb') as f:
f.write(response.content)

我得到一个html文件，而不是zip文件夹。我在网上看了一下，似乎我需要一个杂乱的API令牌。我得到了，然后我把它放在文件夹里，但同样的问题仍然存在。现在文件夹的层次结构是:

project -> [(.kaggle -> [kaggle.json]) and (file.ipynb)].

项目有.kaggle文件夹和文件。在。kaggle里面我有kaggle.json我也登录到kaggle，所以我不知道为什么它一直下载html文件，而不是实际的zip文件。

你可以使用Kaggle Python API:

import kaggle
kaggle.api.authenticate()
kaggle.api.dataset_download_files('birdy654/cifake-real-and-ai-generated-synthetic-images', path='CIFAKE', unzip=True)

使用kaggle进行认证。Json在上面的链接中有详细说明。

我还将数据集上传到GitHub作为一个可能更有用的替代方案，repo可以在这里找到.

如果您还有任何问题，请随时与我们联系。我希望我们的数据集对你的项目有用，祝你好运!

相关内容

最新更新

热门标签：