如何为指定列定义"for"以避免浪费时间



我的数据集有54列。我想定义一个循环("For"(来获得一些指定的列(20列(,然后应用一个简单的函数。我该怎么做?我想避免浪费时间

所以,假设我们有一个包含指定20列的列表,类似于['foo', 'bar', 'baz', ...]

然后我们可以做

specified_columns = ['foo', 'bar', 'baz']
for column in specified_columns:
    df.['new'+column] = df[column].apply(simple_function)

这应该创建一组20个新列,称为new_foonew_bar

如果我们有另一个列表,按照相同的顺序列出20个新列的名称,我们可以这样做:

specified_columns = ['foo', 'bar', 'baz']
new_columns = ['bla', 'ble', 'bli']
for i in range(len(specified_columns)):
    df.[new_columns[i]] = df[specified_columns[i]].apply(simple_function)

最新更新