如何在张量流中混合分类、离散和连续数据作为输入?



我是Tensorflow的新手。我有一个具有连续、离散和分类值的数据集。示例数据如下:

col1    col2    col3  col4  col5  col6  Class
0    22    23.40   45.60  11    1.0   0.0    0.0
1   346    67.40  235.60  23    1.0   1.0    0.0
2    22    67.34  364.66  17    0.0   0.0    1.0
3  1231   124.44  213.89  14    1.0   0.0    1.0

Col1 和 Col4 是离散变量。 Col2 和 Col3 是连续变量。 Col5 和 Col6 是分类变量。 类是目标变量。

我想知道我是否可以将上述数据直接作为输入传递给占位符X.

X = tf.placeholder(tf.float32, [None, numFeatures])

我不必申请tf.one_hot,对吗?因为我的分类变量是二进制的。

张量流如何检测 col5 和 col6 是分类变量?

任何帮助将不胜感激。谢谢!

由于您的变量是二进制的,因此可以将它们视为int您必须创建占位符,稍后将通过传递批处理在训练部分使用。

下面介绍如何声明您的张量流占位符,以便它们具有正确的 dtype。

var1 = tf.placeholder(tf.int32, shape)
var4 = tf.placeholder(tf.int32, shape)
var2 = tf.placeholder(tf.float32, shape)
var3 = tf.placeholder(tf.float32, shape)
var5 = tf.placeholder(tf.int32, shape)
var6 = tf.placeholder(tf.int32, shape)
class_ = tf.placeholder(tf.int32, shape)

为了将变量集提供给模型,您稍后必须将它们连接起来,但在此之前,您应该强制转换张量,以便将所有变量都放在相同的 dtype 中进行串联。

var1 = tf.cast(var1, tf.float32)
...
data = tf.concat([var1,var4, var2,var3, var5, var6], axis=1)

相关内容

  • 没有找到相关文章

最新更新