MapReduce在网络文件系统上读取文本或二进制文件的效率是更高还是更低?



MapReduce在网络文件系统上读取文本或二进制文件的效率是更高还是更低?

如果我使用MPI怎么办?它是否向每个计算节点发送要保存到磁盘的文件?或者它只是保留在主存中,在这种情况下,文件格式无关紧要?

猜自己问题的答案:

我认为MapReduce更愿意使用文本文件,因为它们只读取而不写入,并且无论如何都必须比较文本与文本,因此避免从二进制转换为文本。

我不在乎MPI。它读取一次,然后将数据通过内存缓冲区发送给其他节点,而不是文件。

我的期末考试是今天,这就是我坚持的故事。

最新更新