Hive QL 过滤时最有效的决策是什么 - 使用 In () 或 Not In()?



我正在使用将要提取大量数据的Hive QL运行查询。为了帮助它更快地处理,我将添加一个简单的过滤器,其中column_a不在('xxx'(中。但是,处理查询的最有效方法是什么?不在或不使用?预先感谢:)

纯答案!没关系!数据的过滤将在地图侧进行,无论您提到什么条件,都将通过记录将数据记录应用于每个记录。在与否,在两种情况下都将评估所讨论的每个记录。因此,请使用更直观的内容!

最适合您的实施。

最新更新