增加CNTK中预训练的Resnet模型的图像输入分辨率

我正在使用CNTK的模型编辑语言来加载预先训练的Resnet模型，添加新的最后一层，并在一些新数据集上优化模型。

我还想更改网络架构以接受更高分辨率的图像作为输入（这是可能的，因为我的网络是完全卷积的，没有最后一个 fc 层）。有谁知道如何做到这一点/相关链接？

谢谢！

附言。这是我当前的 .mel 文件的样子（对于 AlexNet）：

#load pre-trained model
model1 = LoadModel("$OrigModel$") #, format=cntk)
SetDefaultModel(model1)
#parameters from original ndl file
cMap4 = 512
fcWScale = 1.13
fcBValue = 0
labelDimNew=10
#add new final layer
newL = DnnLayer(cMap4, $labelDimNew$, pool5, fcWScale, fcBValue)
labelsNew = Input($labelDimNew$, tag="label")
SetInput(ce, 0, labelsNew)
SetInput(ce, 1, newL.z)
SetInput(err, 0, labelsNew)
SetInput(err, 1, newL.z)
SetProperty(newL.z, "output", "true")
#remove old final layer (note: make sure these deletes happen in reverse order)
DeleteNode(OutputNodes.z) 
DeleteNode(OutputNodes.t)
DeleteNode(OutputNodes.b)
DeleteNode(OutputNodes.W)
DeleteNode(labels)
#rename nodes to have same name as before. this might not be necessary.
Rename(labelsNew, labels)
Rename(newL.*, OutputNodes.*)

一种选择是使用一个适配器函数，该函数采用更高的分辨率函数并将其输出插入预训练模型的输入。在python中，它应该很简单。不过，我不确定如何将其扩展到 .mel。

相关内容

最新更新

热门标签：