在关于kedro.io
和kedro.contrib.io
的API文档中,我找不到有关如何从网络连接存储(例如FritzBox NAS(读取/写入数据的信息。
所以我对网络连接存储有点生疏,但是:
如果您可以将网络连接存储挂载到操作系统上并像常规文件夹一样访问它,那么在为给定目录条目编写配置时只需提供正确的
filepath
即可。例如:使用 Python,如何访问 Windows 网络上的共享文件夹?否则,如果访问网络连接存储需要任何特殊内容,则可能需要创建一个自定义数据集,该数据集使用 Python 库与网络连接存储进行交互。像pysmb这样的东西浮现在脑海中。
自定义数据集可以大量借用现有kedro.io
或kedro.extras.datasets
数据集中的逻辑,但您可以将 filepath/fsspec 处理代码替换为pysmb
。