DASK:使用 compute() 引发的错误 'apply() 有一个意外的关键字参数 '如何?



dask 2.15.0,熊猫1.0.3

unknown_dict = dict(map(lambda columnName:(columnName,'unknown'),columns_to_clean))
my_dataframe = my_dataframe.fillna(unknown_dict)
#no problem before compute
with ProgressBar():
print(my_dataframe.isnull().sum().compute()
my_dataframe.persist()

引发以下错误消息:

TypeError Traceback(最近调用最后)带有ProgressBar()的1:---->2打印(my_dataframe.isnull().sum().comute())3 my_dataframe.persist()

C: 计算中的\Users\KHS\lib\site packages\dask\base.py(self,**kwargs)164基于计算165"-->166(结果,)=计算(self,遍历=False,**kwargs)167返回结果168

C: 计算中的\Users\KHS\lib\site packages\dask\base.py(*args,**kwargs)435个键=[x.dask_keys()用于集合中的x]436 postcomputes=[x.dask_postcompute()for x in collections]-->437个结果=时间表(dsk,keys,**kwargs)438返回重新包装([f(r,*a)for r,(f,a)in zip(results,postcomputes)])439

C: get(dsk,result,缓存,num_workers,池,**kwargs)82 get_id=_thread_get_id,83 pack_ exception=pack_,--->84**千瓦85)86

C: get_async(apply_async,num_workers,dsk,result,cache,get_id,rerun_exceptions_locally,pack_exception、raise_exception、回调、转储、加载、**kwargs)484_execute_task(任务、数据)#本地重新执行485其他:-->486 raise_exception(不包括tb)487 res,worker_id=加载(res_info)488 state["cache"][key]=res

C: \Users\KHS\lib\site-packages\dask\local.py在reraise中(exc,tb)314如果exc.回溯不是tb:315提升(不包括回送)(tb)-->316凸起exc317318

C: execute_task(key,task_info、转储、加载、get_id、pack_exception)220尝试:221任务,数据=加载(task_info)-->222 result=_execute_task(任务,数据)223 id=get_id()224结果=转储((结果,id))

C: _execute_task(arg,缓存,dsk)119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C: (.0)中的\Users\KHS\lib\site packages\dask\core.py119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C: _execute_task(arg,缓存,dsk)113"114如果不稳定(arg,list):-->115返回参数中a的[_execute_task(a,缓存)]116 elif istask(arg):117函数,args=arg[0],arg[1:]

C: (.0)中的\Users\KHS\lib\site packages\dask\core.py113"114如果不稳定(arg,list):-->115返回参数中a的[_execute_task(a,缓存)]116 elif istask(arg):117函数,args=arg[0],arg[1:]

C: _execute_task(arg,缓存,dsk)119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C:调用中的\Users\KHS\lib\site packages\dask\optimization.py(self,*args)989如果不是len(args)==len(self.inkeys):990引发ValueError("应为%d个args,得到%d"%(len(self.inkeys),len(args))-->991 return core.get(self.dsk,self.outkey,dict(zip(self.inkies,args))992993 def减少(自身):

C: \Users\KHS\lib\site packages\dask\core.py in get(dsk,out,cache)149表示拓扑排序中的密钥(dsk):150任务=dsk[key]-->151 result=_execute_task(任务,缓存)152 cache[key]=结果153结果=_execute_task(out,cache)

C: _execute_task(arg,缓存,dsk)119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C: (.0)中的\Users\KHS\lib\site packages\dask\core.py119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C: _execute_task(arg,缓存,dsk)119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C: (.0)中的\Users\KHS\lib\site packages\dask\core.py119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C: _execute_task(arg,缓存,dsk)113"114如果不稳定(arg,list):-->115返回参数中a的[_execute_task(a,缓存)]116 elif istask(arg):117函数,args=arg[0],arg[1:]

C: (.0)中的\Users\KHS\lib\site packages\dask\core.py113"114如果不稳定(arg,list):-->115返回参数中a的[_execute_task(a,缓存)]116 elif istask(arg):117函数,args=arg[0],arg[1:]

C: _execute_task(arg,缓存,dsk)119#临时通过其引用计数,并且可以执行某些120#操作到位。-->121返回func(*(args中a的_execute_task(a,cache))122 elif不易腐烂(arg):123返回参数

C: apply中的\Users\KHS\lib\site packages\dask\utils.py(func,args,kwargs)28 def-apply(func,args,kwargs=无):29如果kwargs:--->30返回函数(*args,**kwargs)31其他:32返回函数(*args)

TypeError:apply()获得了一个意外的关键字参数"how">

谢谢"准本",我已经尝试了最少的代码来重现错误,但这是不可能的。

然而,在我的笔记本电脑上,将数据集缩小到原来大小的四分之一是可行的。所以我想这与了解我的系统的阈值和限制有关。非常感谢。

相关内容

最新更新