如何将带字符串的列替换为带整数的列



我正在尝试预测一个数据集,该数据集有一个带有不同字符串的列。例如,有三个品牌,"A"、"B"one_answers"C",我想用数字(例如0、1和2(代替它们。

如果只有两个品牌,我知道如何使用pd.eq

我尝试过使用set,但我想知道是否有一种更简单的方法可以做到这一点,因为我必须用具有5个以上不同字符串的列来替换它,这将非常令人讨厌。

您可以通过选择符合这些条件的记录来替换它们,假设您的数据在df中,并且感兴趣的列是'Brand':

replacement = { 'A': 0, 'B': 1, 'C': 2 }
for key, value in replacement.items():
df.loc[df['Brand'] == key, 'Brand'] = value
df['Brand'].map({'A': 0, 'B':1,'C': 2})

最新更新