Hadoop上的Java UDF输入参数——来自Hadoop上Pig的调用



如果我在Pig中有以下数据结构(关系),并且我想把它传递给Java UDF,想知道输入参数的相关Java数据类型应该是什么?

(学生关系是一个包,模式是ID为int,元组包含一个兴趣包和一个类包)。

student: {id: int,(interest: {(value: chararray)},classes: {(value: chararray)})}

提前感谢,Lin

我认为可以按如下所示进行。

 public class BagUdf extends EvalFunc<DataBag> {
public <returnType> exec(Tuple input) throws IOException {
//iterate over the bag elements
for (Tuple t : (DataBag)input.get(0)) {
     // process tuple t
}
return returnVal;
}

请参阅此链接

最新更新