在启用蜂巢上的酸支撑后。我可以从Hive Table(基于ORC文件的表)插入/Update/Delete Row,想知道可以进行UPSERT吗?因为当用户提供数据时,他们没有指定其插入或更新,如果我们需要在每行插入之前要删除以模拟UPSERT,则可能非常慢,但尚不确定该性能,我们的更新/插入率低,小于5%。对我们来说,延迟并不重要,但是吞吐量肯定很重要。如果Hive当前不支持UpSert,是否有任何支持它的计划?谢谢
工作正在进行中:https://issues.apache.org/jira/browse/browse/hive-10924吞吐量可能会在酸模式下受到限制。
当前,您可以使用完整的加入并进行完整分区/表重写,而不是在酸模式下模拟UPSERT。潜伏期很大,吞吐量实际上是无限的。请参阅此处:https://stackoverflow.com/a/37744071/2700344
一种方法可以是使用Hive JDBC连接执行删除插入或合并在Hive表中。然后执行完整的压实可以在Hive Orc表上执行。压实超过数据后,可以通过SPARK提供。