我正在尝试围绕">"分隔符将一列分成最多五列,但我尝试过的事情还没有解决:
我试过了
select
id,
compoundColumn,
split(compoundColumn," > ")[1] as "first"
split(compoundColumn," > ")[2] as "second"
from table
where compoundColumn is not null
这不起作用,并且
这有点做到了(无论如何是第一部分,而不是第n部分(
select
id,
compoundColumn,
first(split(compoundColumn," > ")) as "first"
nth(compoundColumn," > ")[n] as "second"
from table
我在这里找到了很多例子,但它们似乎都在说使用括号,但括号会抛出错误:
异常:格式错误的 SQL。详细信息:SQL 语句错误: 您的 SQL 语法有误;检查手册 对应于您的MySQL服务器版本,以便使用正确的语法 在 '[1] 附近作为表中的"第一个",其中化合物列不为 NULL" 在 第 3 行。
- SQL 中"first"后面缺少逗号
- 我猜 CloudSQL 基于一些旧版本的 MySQL,它只能使用 substring_index 进行拆分(请参阅下面的查询 - 是的,它冗长而笨拙,case 子句必须清理短字符串(
- 也许尝试用括号
[offset(0)]
或[ordinal(1)]
,这对我们有用,尽管我们使用Postgres方言,也作为 #standardSql,而不是 #legacySql
从第二点开始的SQL:(小提琴(
select id,
case when substring_index(cc,' > ',0) = cc then null else substring_index(substring_index(cc,' > ',1),' > ',-1) end as a1,
case when substring_index(cc,' > ',1) = cc then null else substring_index(substring_index(cc,' > ',2),' > ',-1) end as a2,
case when substring_index(cc,' > ',2) = cc then null else substring_index(substring_index(cc,' > ',3),' > ',-1) end as a3,
case when substring_index(cc,' > ',3) = cc then null else substring_index(substring_index(cc,' > ',4),' > ',-1) end as a4,
case when substring_index(cc,' > ',4) = cc then null else substring_index(substring_index(cc,' > ',5),' > ',-1) end as a5
from d
我终于在 bigquery pull 而不是在 appmaker 中使用正则表达式提取到达了我需要去的地方:
SELECT
CompoundColumn,
REGEXP_EXTRACT(CompoundColumn+">", r'^(.*?)>') first_number,
REGEXP_EXTRACT(CompoundColumn+">", r'^(?:(?:.*?)>){1}(.*?)>') second_number,
REGEXP_EXTRACT(CompoundColumn+">", r'^(?:(?:.*?)>){2}(.*?)>') third_number,
REGEXP_EXTRACT(CompoundColumn+">", r'^(?:(?:.*?)>){3}(.*?)>') fourth_number
FROM
myTable
WHERE
CompoundColumn IS NOT NULL
代码的+">"部分很丑陋,但我无法让它匹配不以括号结尾的字符串(">?"破坏了整个事情(,所以我只是让它们都以括号结尾。
所需的遗留SQL将是:
SELECT id,
compoundColumn,
FIRST(SPLIT(compoundColumn, " > ")) AS "first",
NTH(2, SPLIT(compoundColumn, " > ")) AS "second"
FROM table
有关SPLIT
、FIRST
和NTH
函数的更多信息,请参阅此 BigQuery 文档页面。