熊猫拆分并选择第二个元素

我有一个类似的数据框架：

item_id
26--_-23
24--_-65
12
24--_-54
24
66
23

当我说

时

df['item_id'] = df['item_id'].map(lambda x: x.split('--_-')[0])

我得到：

item_id
26
24
12
24
24
66
23

没关系。但是当我说：

df['par_id'] = df['item_id'].map(lambda x: x.split('--_-')[1])

我有以下错误：

df2['item_id'] = df2['item_id'].map(lambda x: x.split('--_-')[1])
IndexError: list index out of range

然后我决定尝试：

def split(x):
    try: z = x.split('--_-')[1]
    except:  z = None
df2['par_id'] = df2['item_id'].apply(split)

但是在这种情况下，我得到了一个空的par_id列我知道，这可能是一个非常琐碎的问题，但是这里有什么问题？

您可以使用PANDAS函数str.split，然后按str选择列表 - 如果不存在值，则NaN S：

df['item_id'] = df['item_id'].str.split('--_-').str[1]
print (df)
  item_id
0      23
1      65
2     NaN
3      54
4     NaN
5     NaN
6     NaN

细节：

print (df['item_id'].str.split('--_-'))
0    [26, 23]
1    [24, 65]
2        [12]
3    [24, 54]
4        [24]
5        [66]
6        [23]
Name: item_id, dtype: object

在太空上拆分，切开第一项，使用逗号加入：

df['Key'].str.split(' ').str[1:].str.join(',')

相关内容

最新更新

热门标签：