我们有这样的场景,csv(>900 GB(数据文件存储在HDFS文件系统中,在其上定义了Hive 0.14表。我们需要对数据执行一些分析查询,并对数据执行更新。基本上是这种数据量的RDBMS系统。任何人都可以建议RDBMS类型的系统(更新,选择(的潜在选择是什么,牢记性能是一个重要的标准。
PostgreSQL是从EDL加载数据的绝佳选择。您可以将热数据放在那里以执行一些快速查询。
我们有这样的场景,csv(>900 GB(数据文件存储在HDFS文件系统中,在其上定义了Hive 0.14表。我们需要对数据执行一些分析查询,并对数据执行更新。基本上是这种数据量的RDBMS系统。任何人都可以建议RDBMS类型的系统(更新,选择(的潜在选择是什么,牢记性能是一个重要的标准。
PostgreSQL是从EDL加载数据的绝佳选择。您可以将热数据放在那里以执行一些快速查询。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium