Keras PREDICTION 抛出 'TypeError: ufunc 'add' 不包含具有签名匹配类型 dtype('<U4') dtype('<U4') dtype



我构建了一个具有结构的插槽填充(一种序列分类)模型:自定义ELMo嵌入层 - BiLSTM - CRF。

它训练得很好。但是根据预测,我得到:

'TypeError: ufunc 'add' did not contain a loop with signature matching types dtype('<U4') dtype('<U4') dtype('<U4')'.

注意:U4 是一个无符号的整数。

在类似的问题中,建议"使用 predict 时,test_data 应该与 type(training_data[0]) 的数据类型相同,它将返回类型为 (training_labels[0])的数据类型"。我已经确认是的,我的每个测试样本都与training_data[0]的类型相同。

本文末尾的完整错误消息。

注意:该问题可能与我之前需要使用以下命令将训练和测试数据更改为 np.string 的事实有关:

X_train_sents = np.array(X_train_sents, dtype=np.str)
y_train_sents = np.array(y_train_sents, dtype=np.str)

这是为了避免在模型构建过程中出现错误,即:str 没有属性 ndim。如果我不将测试数据转换为 np.str,我会再次收到此错误。

一位同事认为问题出在 Keras 深处的某个添加方法(参见错误)。显然,这是一种特殊的添加方法,用于处理无符号的int,它不应该引起这样的问题。

自定义层松散地基于此人的存储库

重现错误:我在这里设置了一个带有代码和一些虚拟数据的 github 存储库

完全错误:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-15-f71c3fcdc6d2> in <module>
16 print(type(X_train_sents[0]))
17 print(type(X_test_sents[0]))
---> 18 test_pred = model.predict(X_test_sents, y_test)
~/.conda/envs/base_munroke/lib/python3.7/site-packages/keras/engine/training.py in predict(self, x, batch_size, verbose, steps)
1167                                             batch_size=batch_size,
1168                                             verbose=verbose,
-> 1169                                             steps=steps)
1170 
1171     def train_on_batch(self, x, y,
~/.conda/envs/base_munroke/lib/python3.7/site-packages/keras/engine/training_arrays.py in predict_loop(model, f, ins, batch_size, verbose, steps)
280         # Sample-based predictions.
281         outs = []
--> 282         batches = make_batches(num_samples, batch_size)
283         index_array = np.arange(num_samples)
284         for batch_index, (batch_start, batch_end) in enumerate(batches):
~/.conda/envs/base_munroke/lib/python3.7/site-packages/keras/engine/training_utils.py in make_batches(size, batch_size)
367         A list of tuples of array indices.
368     """
--> 369     num_batches = (size + batch_size - 1) // batch_size  # round up
370     return [(i * batch_size, min(size, (i + 1) * batch_size))
371             for i in range(num_batches)]
TypeError: ufunc 'add' did not contain a loop with signature matching types dtype('<U4') dtype('<U4') dtype('<U4')

更新,我找到了解决方案:我将 y 集转换为 np.str 是错误的,例如

y_train = np.array(y_train, dtype=np.str)

我确实需要将 y 集转换为数组,但向该行添加dtype=np.str只是一个疏忽。

我希望我几个小时的痛苦能给别人带来一些用处! :)

相关内容

最新更新