我想从kaggle下载一个数据集,链接是:https://www.kaggle.com/datasets/birdy654/cifake-real-and-ai-generated-synthetic-images在这个链接中有一个下载按钮。它的链接是:https://www.kaggle.com/datasets/birdy654/cifake-real-and-ai-generated-synthetic-images/download?datasetVersionNumber=3我的本地机器上有一个Jupyter项目。当我尝试使用
下载数据集时:url = 'https://www.kaggle.com/datasets/birdy654/cifake-real-and-ai-generated-synthetic-images/download?datasetVersionNumber=3'
response = requests.get(url)
with open('cifake-real-and-ai-generated-synthetic-images.zip', 'wb') as f:
f.write(response.content)
我得到一个html文件,而不是zip文件夹。我在网上看了一下,似乎我需要一个杂乱的API令牌。我得到了,然后我把它放在文件夹里,但同样的问题仍然存在。现在文件夹的层次结构是:
project -> [(.kaggle -> [kaggle.json]) and (file.ipynb)].
项目有.kaggle文件夹和文件。在。kaggle里面我有kaggle.json我也登录到kaggle,所以我不知道为什么它一直下载html文件,而不是实际的zip文件。
你可以使用Kaggle Python API:
import kaggle
kaggle.api.authenticate()
kaggle.api.dataset_download_files('birdy654/cifake-real-and-ai-generated-synthetic-images', path='CIFAKE', unzip=True)
使用kaggle进行认证。Json在上面的链接中有详细说明。
我还将数据集上传到GitHub作为一个可能更有用的替代方案,repo可以在这里找到.
如果您还有任何问题,请随时与我们联系。我希望我们的数据集对你的项目有用,祝你好运!