正如标题所说,我们的数据存在于托管的MySQL数据库中,没有分片或集群。
在这种情况下,Spark的架构优势(内存中并行处理,跨多个数据集连接的能力(是否适用,或者从IO的角度来看,MySQL是否成为瓶颈,使Spark的好处无效?
听起来普通
的旧SQL在您的情况下会更好地工作 - 除非您计划迁移到更多样化的后端和/或从MySQL迁移出去
正如标题所说,我们的数据存在于托管的MySQL数据库中,没有分片或集群。
在这种情况下,Spark的架构优势(内存中并行处理,跨多个数据集连接的能力(是否适用,或者从IO的角度来看,MySQL是否成为瓶颈,使Spark的好处无效?
的旧SQL在您的情况下会更好地工作 - 除非您计划迁移到更多样化的后端和/或从MySQL迁移出去
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium