我在pytorch官方网站上注意到这一点:https://pytorch.org/docs/stable/nn.html
如果满足以下条件:
1(启用了cudnn,
2(输入数据在GPU上,
3(输入数据具有dtype torch.float16,
4(使用V100 GPU,
5(输入数据不采用包装序列格式。
然后,可以选择持久算法以提高性能。
有人可以解释吗?谢谢。
这是指GPU缓存使用量的非常低的级别性能优化,在这里可以更深入地解释(注意:这不是Pytorch材料,但我相信它可以做得很好在解释方面的工作足够(。换句话说,如果满足所有子弹,Pytorch将默认为引擎盖下的其他算法,希望提供更高的RNN
性能。