train_test_split错误与两个CSV文件



我正在处理2个csv文件,我想使用train_testrongplit函数比较两者的值。

我的代码如下:
X = np.append(y1[:100])
X_train, X_test, y_train, y_test = train_test_split(X, y1)

我知道X和y1的长度不相同,我试图修复这个错误:

ValueError: Found input variables with inconsistent number of samples: [4840242, 44898]

然而,在第一行,我目前得到这个错误:

文件"& lt;array_function内部代码,第179行,在附录中TypeError: _append_dispatcher()缺少1个必需的位置参数:'values'

我怎样才能解决这个问题?

您错误地使用了numpy追加函数。该函数期望附加到一个数组。你只是给了它值,而不是这些值应该被附加到的数组(或者反过来,你给了数组,但不是值)。如果y中的前100个条目是您的X,只需写X = y[:100]就足够了。

最新更新