增加CNTK中预训练的Resnet模型的图像输入分辨率



我正在使用CNTK的模型编辑语言来加载预先训练的Resnet模型,添加新的最后一层,并在一些新数据集上优化模型。

我还想更改网络架构以接受更高分辨率的图像作为输入(这是可能的,因为我的网络是完全卷积的,没有最后一个 fc 层)。有谁知道如何做到这一点/相关链接?

谢谢!

附言。这是我当前的 .mel 文件的样子(对于 AlexNet):

#load pre-trained model
model1 = LoadModel("$OrigModel$") #, format=cntk)
SetDefaultModel(model1)
#parameters from original ndl file
cMap4 = 512
fcWScale = 1.13
fcBValue = 0
labelDimNew=10
#add new final layer
newL = DnnLayer(cMap4, $labelDimNew$, pool5, fcWScale, fcBValue)
labelsNew = Input($labelDimNew$, tag="label")
SetInput(ce, 0, labelsNew)
SetInput(ce, 1, newL.z)
SetInput(err, 0, labelsNew)
SetInput(err, 1, newL.z)
SetProperty(newL.z, "output", "true")
#remove old final layer (note: make sure these deletes happen in reverse order)
DeleteNode(OutputNodes.z) 
DeleteNode(OutputNodes.t)
DeleteNode(OutputNodes.b)
DeleteNode(OutputNodes.W)
DeleteNode(labels)
#rename nodes to have same name as before. this might not be necessary.
Rename(labelsNew, labels)
Rename(newL.*, OutputNodes.*)

一种选择是使用一个适配器函数,该函数采用更高的分辨率函数并将其输出插入预训练模型的输入。在python中,它应该很简单。不过,我不确定如何将其扩展到 .mel。

最新更新