映射器功能键



对于天气数据示例,Hadoop权威指南手册中说

"键是文件中的行偏移量"。

map函数的键是如何确定的?它们总是输入文件中的行偏移量吗?如果输入包含多个文件怎么办?

hadoop默认的输入格式是TextInputFormat。这里有解释。在这种格式中,文件被分成几行,密钥就是文件中取出该行的确切位置。

为了理解键和值是如何赋值的,你需要阅读输入格式,这将在本书后面的一整章中描述。

祝你好运。

相关内容

  • 没有找到相关文章

最新更新