如何正确将DASK数据帧作为参数输入到函数



当我将dask dataframe作为参数传递时,他正在转换为pandas dataframe。

print(type(sellout_df))
simulate_sku_predictions(sellout_df.loc[(sellout_df['sku'] == sku) & (sellout_df['store_id'] == store)].compute(), store, sku)

prints => <class 'dask.dataframe.core.DataFrame'>

输入定义的功能

def simulate_sku_predictions(sellout_sku_df, store, sku):
    print(type(sellout_sku_df))

prints => <class 'pandas.core.frame.DataFrame'>

我无法使用Compute和Dask功能。

我是Dask的新手

dask.DataFrame.compute()返回pandas dataframe。因此,该代码不会将DASK数据帧传递给simulate_sku_predictions。参数,

sellout_df.loc[(sellout_df['sku'] == sku) & (sellout_df['store_id'] == store)].compute()

在之前将其作为参数传递给 simulate_sku_predictions

如果将呼叫删除到compute(),则sellout_df.loc[...]将是DASK数据框架,您可以将其传递给simulate_sku_predictions

最新更新