Tensorflow均方误差计算不同于sklearn



我正在尝试使用tensorflow计算mse,并将结果与sklearn.metrics.mean_squared_error方法进行比较。

def mse(y,y_hat):
return tf.reduce_mean(tf.squared_difference(y, y_hat)).eval()
compute_mse = lambda vector1, vector2: mse(vector1,vector2)

我的测试循环

for n in [1,5,10,10**3]:
elems = [np.arange(n),np.arange(n,0,-1), np.zeros(n),
np.ones(n),np.random.random(n),np.random.randint(100,size=n)]
for el in elems:
for el_2 in elems:
true_mse = np.array(mean_squared_error(el,el_2))
my_mse = compute_mse(el,el_2)
if not np.allclose(true_mse,my_mse):
print('Wrong result:')
print("All tests passed")    

但是我的tf函数总是返回0或1。你能告诉我哪里错了吗。

UPD

感谢@apnorton指出了类型的问题。

def mse(y,y_hat):
y_ = tf.Variable(y, tf.float64)
y_hat_ = tf.Variable(y_hat, tf.float64)
return tf.reduce_mean(tf.squared_difference(y_, y_hat_).eval()

如果打印tf函数的所有输出,您会看到它不仅返回1和0,而且只返回整数。这是因为elems的值都是类型numpy.int32。在执行平均步骤时,sklearn函数似乎将这些转换为浮点,而张量流方法则没有。

要查看固定的变体,请考虑将compute_mse行更改为:

my_mse = compute_mse(el.astype(float),el_2.astype(float))

编辑:针对评论中的问题,我会避免创建仅用于强制转换的变量。相反,我建议使用tf.to_float方法:

def mse(y,y_hat):
return tf.reduce_mean(tf.squared_difference(tf.to_float(y), tf.to_float(y_hat))).eval()

最新更新