如何在pydatatable中根据其数据类型选择列?

我正在创建一个数据表，如下所示，

spotify_songs_dt = dt.fread('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2020/2020-01-21/spotify_songs.csv')

其列类型为，

spotify_songs_dt.stypes

在这里，我只想取出DT的数字字段，以及如何以数据表方式实现它？在熊猫数据帧中，我们有一个函数 select_dtypes((。

如果您有框架DT，那么选择特定类型的列的最直接方法是在DT[:,j]选择器中使用类型本身：

DT[:, bool]          # all boolean columns
DT[:, int]           # all integer columns
DT[:, float]         # all floating columns
DT[:, str]           # string columns
DT[:, dt.int32]      # columns with stype int32
DT[:, dt.ltype.int]  # columns with ltype `int`, same as DT[:, int]

还可以提供要选择的类型列表：

DT[:, [int, float]]          # integer and floating columns
DT[:, [dt.int32, dt.int64]]  # int32 and int64 columns

有时，删除不需要类型的列而不是选择所需的列也可能很有用：

del DT[:, str]

相关内容

最新更新

热门标签：