TensorFlow:简单的音频识别网络教程错误:分配需要两个张量的形状才能匹配.LHS形状= [12] RHS Sha



当我使用开发人员本身在第一个旅行中提供的数据运行上述教程时/speech_commands/freeze.py -start_checkpoint =/tmp/scied_commands_train/conv.ckpt-18000 -unput_file =/tmp/my_frozen_graph.pb)工作正常。我能够获得模型并进行测试。

但是,当我添加自己的数据文件夹时,该文件包含一个单词的多个音频文件,并在已经存在的单词文件中,然后在" wanted Word flag"中选择该单词并运行必要的命令时,培训继续进行。但是,在获取模型(上面提到的命令)时,我会收到以下错误:

InvalidArgumentError(有关追溯性,请参见上文):分配需要两个张量的形状才能匹配。LHS Shape = [12] Rhs Shape = [3]

我如何克服这一点?这是TensorFlow中的错误吗?我已经检查了一下,发现先前培训的检查点文件可能会干扰新的培训。但是,即使我创建一个新文件夹来存储最新的检查点文件,问题仍然存在。

谢谢。

这是因为您只有一个音频文件夹,即只有一个训练集,在freeze.py中,您没有将其更改为标签(10个标签 未知和沉默)13。

您要做的就是转到freezy.py并将其更改为数据集而不是默认值。

最新更新