我刚刚开始使用 CNTK C# API,到目前为止,如果我以可以使用全矩阵阅读器读取的方式编写文件,则加载文件没有问题,例如,MNIST 教程示例:
MinibatchSourceminibatchSourceExistModel = MinibatchSource.TextFormatMinibatchSource( Path.Combine(ImageDataFolder, "MNIST_test.ctk"), streamConfiguration);
不过,我对稀疏的数据感到困惑。如果有一个 C# 参考,其中包含使用小批量源加载的所有可能输入形式的示例,这将很有帮助。
我需要保存文件中的所有零吗?是否有一个示例文件显示如何写入稀疏数据并将其加载以用作 MinibatchSource 输入?
谢谢
我创建我的.CTF 具有稀疏数据,如下所示。它是具有 4 个不同类的数据,并具有稀疏特征数组,其中包含的所有特征都设置为 1
|c 0 0 0 1 |f 3:1 11:1 20:1 23:1 25:1 94:1
|c 0 0 1 0 |f 3:1 5:1 16:1 23:1 25:1 189:1 190:1
CTF 文件格式更灵活,但这有效,我可以使用 C# API 作为小批量源来提供它。
本文档中有很好的例子(跳过第一部分)https://learn.microsoft.com/en-us/cognitive-toolkit/brainscript-cntktextformat-reader