我正在尝试测量变量的最大大小,我可以使用spark广播广播。
我没有找到任何关于这个问题的解释。
有人测量过吗?spark有广播大小的配置吗?
广播限制现在增加到8gb。
目前是~2GB。在序列化期间,您广播的任何内容都转换为java字节数组,并且java数组的最大大小为Integer。MAX_VALUE你得到这个限制。目前可能会有一些努力来增加这个限制:SPARK-6235
我正在尝试测量变量的最大大小,我可以使用spark广播广播。
我没有找到任何关于这个问题的解释。
有人测量过吗?spark有广播大小的配置吗?
广播限制现在增加到8gb。
目前是~2GB。在序列化期间,您广播的任何内容都转换为java字节数组,并且java数组的最大大小为Integer。MAX_VALUE你得到这个限制。目前可能会有一些努力来增加这个限制:SPARK-6235
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium