我有以下文件tax_cal
我想在猪中加载:
101,5|2;3|2
102,3|1;4.5|2;4|1
103,2|1;5|2;5.6|3
输出:
101,5|2,3|2
102,3|1,4.5|2,4|1
103,2|1,5|2,5.6|3
此外,我将把这个输出文件传递给python UDF来计算总价。
我怎样才能做到这一点?
所以 pig 的基本加载命令如下所示,但我不确定您的文件示例数据类型。尝试在下面查看并检查是否可以根据需要对其进行修改。
A = LOAD '(your_file_name)' USING PigStorage(',') AS (bill_number:INT, tax:chararray);