无法使用Apache Pig加载数据



我有以下格式的csv数据:

id,name,price,information
12,Pants,50.00,{Clothes & Shoes: 5}

这是我的猪脚本:

grunt> sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:chararray);

问题是,当我加载信息作为字符,因为我不能访问类别或数量本身。我试着这样做:

information:tuple(category:chararray, quantity:int)

但是没有成功。

我该怎么办?加载信息的最佳方式是什么,这样我就可以同时访问类别和数量。

谢谢

您拥有的是Bag而不是Tuple。

()元组用圆括号()括起来。

{}内袋用大括号{}括起来。

你可以像这样加载

sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:bag{});

最新更新