随机选择数据后如何选择数据帧的剩余部分?
这将提供80%的数据。但我也想要剩下的20%。
df.sample(压裂= 0.8)
您可以使用:
df_sample = df.sample(frac=0.8)
然后:
df_remains = df[~df.index.isin(df_sample.index)]
由于您还安装了numpy
,这是一个Pandas依赖项,您可以这样做:
import numpy as np
p = .8
msk = np.random.rand(len(df)) < p
sample = df[msk]
remains = df[~msk]