我一直在学习PoseNet,以便在我的健康相关研究工作中使用它。
我印象深刻的是,mobilenet如何能够保持高精度,同时通过调整我的问题产生的几个参数来减少对CPU(或GPU/NPU)的依赖。
我注意到在mobilenet的官方论文中,引入了两个乘数:alpha和rho。我将跳过对这两个参数的解释。我想知道最新PoseNet模型的mobilenet的alpha和rho的每个值是什么。此外,我想知道是否有参数(特别是alpha和rho)调整的指导方针,以及在训练模型之前如何设置和验证两者的值。
比如,如果alpha的选择值是0.5,我想知道为什么这个值比0.75或0.25好。我的问题是:
- mobilenet(用于训练PoseNet的版本)的alpha和rho的值是什么?
- 为什么/如何选择/验证这些数字?
在https://www.tensorflow.org/lite/models/pose_estimation/overview使用alpha=1.0。alpha乘以每个卷积的输入/输出通道数,对于alpha=1.0,第一个卷积层有32个通道。尽管如此,也有带有其他主干的posenet,您可以从TF.js示例中轻松尝试。https://github.com/tensorflow/tfjs-models/tree/master/posenet
rho值在某种程度上更理论化,在原始论文中它说
在实践中,我们通过设置输入分辨率来隐式地设置ρ。