将卷积特征回归为旋转的四元数表示是什么意思?



我对机器人操作很感兴趣,我正在阅读论文"PoseCNN:杂乱场景中用于6D对象姿势估计的卷积神经网络",并在介绍部分找到了以下句子,其中解释了PoseCNN的三个相关任务。这是第三个任务。

3D 旋转 R 是通过将对象边界框内提取的卷积特征回归到 R 的四元数表示来估计的。

将卷积特征回归为旋转的四元数表示是什么意思? 如何回归到四元数表示? 我们也可以使用旋转矩阵代替四元数吗?我们可以说将卷积特征回归到旋转矩阵吗?如果是,两者之间有什么区别?

">

回归卷积特征"意味着您使用网络提取的特征来预测一些数字。

在您的情况下,您正在尝试预测表示旋转矩阵的四元数的数量。

我认为他们回归四元数而不是旋转矩阵的原因是因为它们更紧凑,数字更稳定,效率更高。有关差异的更多信息,请参阅四元数和空间旋转

另外,我认为您可以尝试直接回归旋转矩阵,如果您查看它们用于四元数回归的损失,您会发现它们将四元数转换为旋转矩阵表示。所以损失本身在旋转矩阵上,而不是直接在四元数上

最新更新