如何在Tensorflow中的估算器分类中为标签的分类值提供一个热编码



我有一个数据集,其中我的字符串值在标签中进行分类。我将数据集加载到TensorFlow中,并为不同功能定义了功能列。由于我在标签中也有分类数据,因此如何给它们提供。一个热编码以使estectator.linearClassifier可以学习数据并预测标签?

您可以使用pandas。假设您已经在dataFrame" DF"中具有非分类功能。

使用可以使用:

import pandas as pd
featurelist_categorical = ['Feature A',
           'Feature B']
for i,j in zip(featurelist_categorical, ['A','B']):
  df = pd.concat([df, pd.get_dummies(data[i],prefix=j)], axis=1)

不是必需的功能前缀,但是在多种类别功能的情况下会特别帮助您。

另外,如果您不想出于某种原因将功能分为数字,则可以使用h2o.ai。使用H2O,您可以将分类变量直接馈送到文本中。

最新更新