如何忽略'|'管道分隔符读取谷歌表格数据在谷歌大查询中?



我使用Google Sheets作为Supermetrics填充的数据存储。我需要在Google BigQuery中阅读这些内容,以连接多个源并使用SQL操作数据。

当我提取字符串字段时,其中一些字段包含管道字符"|"BQ会自动用错误的数据分隔这些填充字段,并导致查询失败。

有没有办法连接到Google Sheets并告诉BQ忽略管道字符?

示例字段为:

test~wm~helo_thisisafield_bn~thisisanotherfieldbm|H4|Hello

BQ将其读取为三个字段:

test~wm~helo_thisisafield_bn~thisisanotherfieldbm, H4, Hello

其与模式集不匹配。我无法在架构中解释这一点,因为|的数量和存在不是固定的。

我有什么办法可以忽略这一点吗?我可以设置一个从CSV提取数据的分隔符,但不能从Google Sheets afaict提取数据。

到目前为止,我唯一的解决方案是在一个字段中读取整个电子表格,并在SQL中进行拆分,这并不理想。

在BigQuery中创建表时,选择Google Drive作为Location并指定Google Sheet的URL后,不要选择Google Sheet in File Format,而是选择CSV。

然后,您可以在创建选项中向下指定分隔符。选择逗号,奇怪的是,尽管文件是谷歌表单,但它对我有效。

最新更新