MapReduce在网络文件系统上读取文本或二进制文件的效率是更高还是更低?
如果我使用MPI怎么办?它是否向每个计算节点发送要保存到磁盘的文件?或者它只是保留在主存中,在这种情况下,文件格式无关紧要?
猜自己问题的答案:
我认为MapReduce更愿意使用文本文件,因为它们只读取而不写入,并且无论如何都必须比较文本与文本,因此避免从二进制转换为文本。
我不在乎MPI。它读取一次,然后将数据通过内存缓冲区发送给其他节点,而不是文件。
我的期末考试是今天,这就是我坚持的故事。