视觉转换器模型在vit-keras



我在vit-keras中使用了vit_b32和vit_b16模型。vit-keras中还有哪些可用的模型及其输入图像大小?是否有任何组合模型(ResNet+Vit(可用?感谢

另外两个选项是vit_l16和vit_l32。每个模型都是使用build_model方法创建的,并且在build_mode方法中检查图像大小。image_size必须是patch_size的倍数(patch_size16表示vit_b16或vit_l16,32表示vit_b32或vit_l32(。

最新更新