如果缺失值大于阈值,使程序停止



我正在组织python代码从jupyter笔记本到文本编辑器中的OOP样式。我想使程序摄取数据,检查最大空值,如果它高于阈值,打印自定义消息并停止程序。

例如:

class ProcessData():
def read_data(path):
df = pd.read_csv(path)
# Deal with NA values
try:
max_null = df.isnull().mean().max()
except max_null > 0.01:
raise Exception(f"Missing value percentage too high: {max_null}. Review data")
else:
df.dropna(inplace=True, inplace=True)
return df

正确吗?还是过于复杂?

您只是想使用if,除了期望从BaseException继承的异常

https://docs.python.org/3/library/exceptions.html

if condition:
raise Exception(f"failed due to {condition}")

你也可以避免创建一个只做一件事的类;只需创建一个扩展名为.py的文件并将函数放入其中就足以创建一个新的名称空间

import myfile  # namespace from myfile.py
myfile.function_in_myfile()

最新更新