正在分析封闭列表中的CSV列值

  • 本文关键字:CSV 列值 列表 pandas csv
  • 更新时间 :
  • 英文 :


我正在尝试加载此CSV:https://www.kaggle.com/miroslavsabo/young-people-survey使用Pandas并训练TensorFlow模型。该csv内的一些值来自封闭列表,例如";吸烟;具有可能的值"0";从不吸烟"尝试吸烟"当前吸烟者";。

我想做的是为每个值自动创建一个二进制列因此,我将有3列,而不是1列包含这3个可能的值"从不吸烟"尝试吸烟"当前吸烟者";,如果原始列中的值与列的名称相同,则每列都将填充1,否则将为零。

tensorflow是否有一些自动的方法来对每个包含封闭列表中的值的列执行此操作?

pandas.get_dummies()是专门为此而设计的。参见文档

在你的情况下,它将是(直接从那里举个例子(

clms = pd.Series(list(["never smoked", "tried smoking", "current smoker"]))
your_pd.get_dummies(clms)

相关内容

  • 没有找到相关文章

最新更新