我正在尝试规范化用户项目矩阵,但我想使用以下公式:
(df.values-df.values.min())/(df.values.max()-df.values.min())
在这样的数据帧中。
您可以创建一个函数并在其他函数---中重用
def compute_function(df):
_count = (df.values-df.values.min())/(df.values.max()-df.values.min())
df = df.withColumn("new_column", F.lit(_count))
return df
df = compute_function(df)
df.show()