我的数据集有54列。我想定义一个循环("For"(来获得一些指定的列(20列(,然后应用一个简单的函数。我该怎么做?我想避免浪费时间
所以,假设我们有一个包含指定20列的列表,类似于['foo', 'bar', 'baz', ...]
然后我们可以做
specified_columns = ['foo', 'bar', 'baz']
for column in specified_columns:
df.['new'+column] = df[column].apply(simple_function)
这应该创建一组20个新列,称为new_foo
、new_bar
等
如果我们有另一个列表,按照相同的顺序列出20个新列的名称,我们可以这样做:
specified_columns = ['foo', 'bar', 'baz']
new_columns = ['bla', 'ble', 'bli']
for i in range(len(specified_columns)):
df.[new_columns[i]] = df[specified_columns[i]].apply(simple_function)