对值应用仿射变换

我使用TF.js在浏览器中为输入图像运行关键点预测模型。我想使用TF.js和webgl后端将仿射变换应用于每个关键点的值。

对于每个关键点的值，我想做translate、scale和rotation。

输入

作为模型预测的结果，我有一个形状为[coord, n]的张量，其中coord是像素中关键点的[x, y]位置。

我的张量

inputTensor.print();
> Tensor
[[103.9713821, 128.1083069], // <- [x, y]
[103.7512436, 107.0477371],
[103.3587036, 115.1293793],
[99.65448   , 92.0794601 ],
[103.9862061, 101.7136688],
[104.2239304, 95.8158569 ],
[104.6783295, 82.7580566 ]]

公式

我看到tf.image.transform使用以下公式来计算像素位置。

(x', y') = ((a0 x + a1 y + a2) / k, (b0 x + b1 y + b2) / k)其中k = c0 x + c1 y + 1.

我有[a0, a1, a2, b0 b1, b2, c0, c1]的值，所以我似乎只需要一种方法将这个公式应用于张量中的每个(x，y(对。

CPU示例(我需要它在TF.js上(

我试过用THRE.js在CPU上进行转换。它很有效，但太慢了。希望它能给你一些我所期望的想法。

const landmarks: Float32Array = inputTensor.dataSync();
const output: Point3D[] = [];
for (let i = 0; i < landmarks.length - 1; i += 2) {
const x = landmarks[i];
const y = landmarks[i + 1];

const mat4 = new Matrix4();
mat4.identity();

// Fill in with the basic values
mat4.multiply(new Matrix4().makeTranslation(x, y, 0));
// Scale 
mat4.multiply(
new Matrix4().makeScale(
1 / scaleX,
1 / scaleY,
1,
),
);
// Rotate
mat4.multiply(new Matrix4().makeRotationZ(rotate));
// Translate
mat4.multiply(
new Matrix4().makeTranslation(
translateX,
translateY,
0,
),
);
const p = new Vector3(x, y, 0).applyMatrix4(mat4);
output.push(new Point3D(p.x, p.y, p.z));
}

纸币

就我所见，tf.image.transform对我不起作用，因为它与元素的位置一起操作，但我需要与值一起操作。

这很容易，但在每个点上使用大矩阵乘法的处理是在使用时间过程，您可以将其应用于更改的刷新率或范围。识别矩阵可以更快地确定输入图片的变化程度，这是正确的方法。

[示例]：

y1 = tf.keras.layers.Cropping2D(cropping=((start_y, pic_height - box_height - start_y), (start, pic_width - box_width - start)))(picture)
target_1 = tf.keras.layers.Cropping2D(cropping=((previous_start_y, pic_height - box_height - previous_start_y), (previous_start, pic_width - box_width - previous_start)))(char_1)
temp_3 = tf.where(tf.math.greater_equal( np.asarray(y1, dtype=np.float32), np.asarray(target_1, dtype=np.float32)), [1.0], [0.0]).numpy()
temp_3 = tf.math.multiply( temp_3, y1, name=None )

样品

相关内容

最新更新

热门标签：