我正在将一个bigquery表作为CSV导出到一个公共的谷歌云存储桶中。从那里我可以通过HTTP公开托管它。BigQuery导出(又名提取(功能似乎没有正确设置文件的Google云存储元数据。
导出器将"内容类型"字段设置为application/octet-stream
。因为它是一个CSV文件,所以我希望它设置为text/csv
(或者text/plain
(。为什么?正如谷歌在这里概述的那样,出于各种原因,这是一种最佳实践。
我在api文档中看不到任何选项来控制这一点。
另一个问题:当我将configuration.extract.compression
设置为GZIP
时,GCS中生成的文件没有将Content-Encoding
属性设置为"gzip"。如果出口商也这样做就好了!
正如文档[1]所说,application/octet-stream
是在上传器未指定内容类型时设置的。在这种情况下,BQ导出是上传程序,您不能指定它,它将被设置为那样。我看到你创建了一个功能请求,要求这样做。
一种变通方法是编辑GCS存储桶中每个文件的元数据。您可以通过使用UI、控制台或编码[2]来实现这一点。