将Alexa数据导入Amazon RedShift



我已经获取了每日转储文件并将其解压缩,然后将其放回s3。

当我尝试在postgresql中执行复制语句时,我收到以下错误

Missing newline: Unexpected character  0x14 found at location 4

查询:

copy temp from 's3://bucket/top-1m.csv' credentials 'blah blah blah';

我必须在每一行中添加一些字符吗?

原始数据:

1,facebook.com
2,google.com
3,youtube.com
4,yahoo.com
5,amazon.com
6,baidu.com
7,wikipedia.org
8,live.com

Redshift COPY命令使用PIPE'|'作为默认分隔符。如果您的文件由另一个字符(在您的情况下是逗号)分隔,那么您所需要做的就是将DELIMITER关键字添加到COPY命令中。

copy temp from 's3://bucket/top-1m.csv' credentials 'blah blah blah' delimiter as ',';

或对于逗号分隔的文件:

copy temp from 's3://bucket/top-1m.csv' credentials 'blah blah blah' csv;

从's3://bucket/top-1m.csv'凭据'blah-blah-'delimiter','复制临时;

最新更新