如何使用标签将txt文件数据集排序为两个数据集



我用加载了数据集

np.loadtxt("dataset")

哪个给了我一个数组?我想我要做的是对这些内部数组进行排序,这些数组由三个变量x、y和z组成,其中z要么是+1,要么是-1,这表示它是正的还是负的。

我想做的是将这些数组分解为两个单独的数组进行处理,这样我就可以将负标记的数组与正标记的数组进行比较。

示例数据集

[[ 1 2 1 ],
[ 2 1 -1 ],
[ 3 2 1 ]]

这就是我到目前为止对的看法

negex = []
posex = []
if dataset[2] < 0
negex.append()
else
posex.append()

我知道这是错误的,但这是我能想到的最好的。我之所以放置数据集[2],是因为我正在寻址数组的第三个变量,基本上我是说,如果小于0,即负,则附加到negex,如果不小于0,则附加至posex

最终,我想将这个数据集转换到可以将其插入matplotlib并获得积分的程度,而且我只允许使用numpy。

您可以将数据集分解为两个独立的数组,如下所示:

negex, posex = np.delete(dataset[dataset[:,2] < 0],2,1)  , np.delete(dataset[dataset[:,2] > 0],2,1)

最新更新