在 pig 脚本中定义元组数据



我目前正在调试一个猪脚本。我想直接在 Pig 文件中定义一个元组(而不是基本的"加载"函数)。

有没有办法做到这一点?

我正在寻找这样的东西:

A= ('name#bob'','age#29';'name#paul','age#12')

转储将返回:

('bob',29)
('paul',12)
事实上,在

猪身上这样做是不可能的。如果您只想调试,请在 hadoop中创建文件并加载该文件。将您想要的数据写入文件(如果可能的话,您会手动创建的任何数据)并上传它。然后用猪装。

以下(肮脏的)技巧可以完成这项工作:- 创建一个文件,有一个空行并将其存储到您的HDFS。- 加载它:行=加载/用户/toto/oneline文件使用..- 创建自己的数据:每行生成"鲍勃"作为名称,22作为年龄;

最新更新