TensorFlow:CAN数据集包含字符串类别值



使用TensorFlow,从数据包含数字值的示例中很容易确定。例如:

x_train = [1, 2, 3, 4]
y_train = [0, -1, -2, -3]

但是,它也可以与字符串类别值一起使用吗?例如:

x_train = ["sunny", "rainy", "sunny", "cloudy"]
y_train = ["go outside", "stay inside", "go outside", "go outside"]

如果没有,我必须假设TensorFlow具有与分类值合作的方法。也许通过一些巧妙的技巧,例如以某种系统的方式将其转换为数字值。

是的,TensorFlow确实支持具有分类功能的数据集。与他们合作的最简单方法也许是使用功能列API,该列提供了诸如tf.feature_column.categorical_column_with_vocabulary_list()(用于处理小型,已知的类别集)和tf.feature_column.categorical_column_with_hash_bucket()(用于处理大型且可能无限的类别集)等方法。

相关内容

最新更新