AWS EMR Python进程异常退出错误



当我尝试在AWS EMR Zeppelin with Spark中运行以下代码时:

%spark.pyspark
knn_imputer = KNNImputer()
pre_stage_1.iloc[:, :] = knn_imputer.fit_transform(pre_stage_1.toPandas())

我得到了以下错误:

Python process is abnormally exited, please check your code and log.

pre_stage_1是一个大约有1000000行数据集。

我该如何修复它?

我最近得到了这个错误,并通过重新启动Spark解释器来修复。

(为了调试,我注释掉了我的原始代码,只是尝试print('hi'),它给出了相同的错误,所以我知道这不是我试图运行的代码的问题)

最新更新