我有以下格式的csv数据:
id,name,price,information
12,Pants,50.00,{Clothes & Shoes: 5}
这是我的猪脚本:
grunt> sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:chararray);
问题是,当我加载信息作为字符,因为我不能访问类别或数量本身。我试着这样做:
information:tuple(category:chararray, quantity:int)
但是没有成功。
我该怎么办?加载信息的最佳方式是什么,这样我就可以同时访问类别和数量。
谢谢
您拥有的是Bag而不是Tuple。
()元组用圆括号()括起来。
{}内袋用大括号{}括起来。
你可以像这样加载
sample = LOAD 'data.csv' USING PigStorage (',') AS (id:int, name:chararray, price:double, information:bag{});