为卷积神经网络准备数据集



我正在尝试实现卷积神经网络(CNN)模型来对手势进行分类。数据集不容易获得,因此我需要准备它。

我应该如何准备数据集?我捕获的图像是否应该包含除手或只有手之外的对象?尽管背景和框架中有其他对象,但哪个会给我一个准确的模型,该模型可以准确地工作?

良好的数据集用于您的问题:

您应该考虑在背景中涉及不同的背景和对象。

以下链接可能会帮助您:

https://blog.keras.io/building-powerful-image-classification-models-using-very-very-little-data.html

https://www.quora.com/computer-vision-vision-what-is-the-best-way-way-to-collect-train-and-train-and-test-data-images-for-object-robject-romegnition-prognition-job

这是一个示例:http://cims.nyu.edu/~tompson/nyu_hand_pose_dataset.htm

它包含其他图像将意味着您必须在管道中实现某些东西以隔离手。我建议只在图像中放手,以便您可以立即在图像上进行建模。

使用多分辨率CNN在该区域中的许多CNN体系结构。因此,在您的数据准备中,只需做出多个分辨率,并馈送到多输入CNN。您可以使用KERAS功能API进行此操作。低RES图像可以很好地区分某些非常不同的姿势,而更高的RES可以集中在小差异上。

显然,标准数据增强不适合手工姿势。诸如镜像或更改角度之类的东西可能使您的数据不适合给定标签。因此,如果您没有那么多的数据,请对数据的增加有点保守。

最新更新