我正试图使用GSUTIL和sed删除GCS中.csv文件头(第一行(末尾的管道。以下命令产生输出sed: can't read ... No such file or directory
sed 's/58_rxsig"|"/58_rxsig1/' gs://../file.csv
58_rxsig是头行中的最后一个字段名,所以我想找到文字字符串"58_rxsig|",然后用文字字符串"58 _rxsig"替换,但我显然无法获得正确的语法。
关于如何做到这一点,有什么想法吗?
样本输入:
12_word|
期望输出:
12_word
sed
命令不知道如何从GCS读取文件。您需要将文件的内容从GCS下载到本地文件,然后将其作为最后一个参数提供给sed
,例如,如果您有一个名为"的对象;a/b/c.txt";在你的桶里:
gsutil cp gs://bucket/a/b/c.txt my/local/directory/
sed <your flags and arguments here> my/local/directory/c.txt
另一种选择是使用gsutil cat
并使用管道将流重定向到sed
命令。
gsutil cat gs://<bucket>/<blob> | sed <flags & arguments>