我搜索了很多,但找不到任何准确的答案。一些网站说,模型参数和培训数据存储在RAM上,需要在需要时获取,但不会使培训过程降低。另外,如果要将参数存储在GPU上,为什么要训练一个消耗我所有GPU内存的模型?谢谢。
是的,它们存储在系统或gpu ram中(它们还能存储在哪里?)。
例外可能是培训数据,如果它不适合RAM,则使用批处理培训,并且一次仅将一部分培训数据(一批或几批)存储到RAM中。
我搜索了很多,但找不到任何准确的答案。一些网站说,模型参数和培训数据存储在RAM上,需要在需要时获取,但不会使培训过程降低。另外,如果要将参数存储在GPU上,为什么要训练一个消耗我所有GPU内存的模型?谢谢。
是的,它们存储在系统或gpu ram中(它们还能存储在哪里?)。
例外可能是培训数据,如果它不适合RAM,则使用批处理培训,并且一次仅将一部分培训数据(一批或几批)存储到RAM中。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium