将 CSV 转换为 ORC 文件格式



我在 BLOB 存储中有一个包含逗号分隔值的文件。如何将此.txt文件转换为ORC格式。我正在将此数据加载到Azure SQL DW中,而不是使用Java。请分享你对此的看法。

数据

A,B,C,
D,E,F,

文件需要在 BLOB 存储中转换为 .txt 到 ORC 格式。

所以像这样:

CREATE EXTERNAL TABLE test_orc
WITH   
    (   
        LOCATION = '/TEST/a.orc',  
        DATA_SOURCE = SIMPLE,  
        FILE_FORMAT = TRANS_HEADER_ORC  
    )  
AS SELECT * FROM test