如何将文件加载到带有多个分隔符的 pig 中?



我有以下文件tax_cal我想在猪中加载:

101,5|2;3|2

102,3|1;4.5|2;4|1

103,2|1;5|2;5.6|3

输出:

101,5|2,3|2

102,3|1,4.5|2,4|1

103,2|1,5|2,5.6|3

此外,我将把这个输出文件传递给python UDF来计算总价。

我怎样才能做到这一点?

所以 pig 的基本加载命令如下所示,但我不确定您的文件示例数据类型。尝试在下面查看并检查是否可以根据需要对其进行修改。

A = LOAD '(your_file_name)' USING PigStorage(',') AS (bill_number:INT, tax:chararray); 

最新更新