地图侧连接如何拆分输入文件



如果我有两个输入文件夹,每个文件夹包含 100 个输入文件,并且我使用了映射端连接。我想知道Hadoop将创建多少映射器任务。当我们使用映射端连接时,hadoop 如何拆分输入文件。

每边正好有 100 个文件的映射端连接将生成 100 个映射任务。

相关内容

  • 没有找到相关文章

最新更新