如果我有两个输入文件夹,每个文件夹包含 100 个输入文件,并且我使用了映射端连接。我想知道Hadoop将创建多少映射器任务。当我们使用映射端连接时,hadoop 如何拆分输入文件。
每边正好有 100 个文件的映射端连接将生成 100 个映射任务。
如果我有两个输入文件夹,每个文件夹包含 100 个输入文件,并且我使用了映射端连接。我想知道Hadoop将创建多少映射器任务。当我们使用映射端连接时,hadoop 如何拆分输入文件。
每边正好有 100 个文件的映射端连接将生成 100 个映射任务。
javascript python java c# php android html jquery c++ css ios sql mysql arrays asp.net json python-3.x ruby-on-rails .net sql-server django objective-c excel regex ruby linux ajax iphone xml vba spring asp.net-mvc database wordpress string postgresql wpf windows xcode bash git oracle list vb.net multithreading eclipse algorithm macos powershell visual-studio image forms numpy scala function api selenium