我有一个数据集X
,y
其中X
是观察n*p
的矩阵,y
响应向量n*1
。
我想在不丢失"逐行"关系的情况下打乱y
和X
行。
如何使用numpy
或scipy
或sklearn
轻松做到这一点?
你的意思是你想保持行之间的对应关系 X
和 y
?生成随机索引并用它们索引两个数组:
>>> perm = np.random.permutation(X.shape[0])
>>> X = X[perm]
>>> y = y[perm]