' flow_from_dataframe() '自定义预处理



我试图使用kerasImageDataGenerator.flow_from_dataframe()方法在飞行中生成图像数据,因为我正在研究的数据集太大,无法一次加载到内存中。

源镜像数据文件为DICOM文件,不支持flow_from_dataframe()方法。

是否可以(容易地)扩展flow_from_dataframe()来处理DICOM(或其他不支持的)图像/输入?

也许可以在每个不受支持的文件上运行一个自定义预处理函数,返回一个规范化的(窗口/光度校正的)numpy数组,然后允许ImageDataGenerator实例继续。

我可以在我自己的安装上编辑源代码,但是可以在vanilla keras上使用的通用解决方案是首选,以确保可移植性到其他平台(特别是Kaggle)!!

这个问题的解决方案可以在Keras github问题跟踪器/功能请求中找到:https://github.com/keras-team/keras/issues/13665

可以基于keras.utils.Sequence作为超类创建自定义数据生成器。

最新更新