如何将Varchar转换为Presto Athena的阵列



我的数据以 VARCHAR格式。我想将此数组的两个元素分开,以便我可以从JSON中提取一个键值。

数据格式

[
  {
    "skuId": "5bc87ae20d298a283c297ca1",
    "unitPrice": 0,
    "id": "5bc87ae20d298a283c297ca1",
    "quantity": "1"
  },
  
{
    "skuId": "182784738484wefhdchs4848",
    "unitPrice": 50,
    "id": "5bc87ae20d298a283c297ca1",
    "quantity": "4"
  },
]

例如,我想从上面的列中提取skuid。因此,我的提取后的数据应该看起来像:

1 5bc87ae20d298a283c297ca1
2 182784738484wefhdchs4848

铸造数组也不起作用:

SELECT CAST(col AS ARRAY)

给出以下错误:

未知类型:数组

所以我无法解开数组。

我该如何解决这个问题

您可以将解析值作为JSON,将其施加到结构化的SQL类型(数组/MAP/ROW(的组合,并用准则来提取数组中的元素单独的行。请注意,这仅在JSON有效载荷中的数组元素没有尾随逗号的情况下才起作用。您的示例有一个,但从下面的示例中删除。

WITH data(value) AS (VALUES
 '[
    {
      "skuId": "5bc87ae20d298a283c297ca1",
      "unitPrice": 0,
      "id": "5bc87ae20d298a283c297ca1",
      "quantity": "1"
    },
    {
      "skuId": "182784738484wefhdchs4848",
      "unitPrice": 50,
      "id": "5bc87ae20d298a283c297ca1",
      "quantity": "4"
    }
  ]'
),
parsed(entries) AS (
  SELECT cast(json_parse(value) AS array(row(skuId varchar)))
  FROM data
)
SELECT ordinal, skuId
FROM parsed, UNNEST(entries) WITH ORDINALITY t(skuId, ordinal)

生产:

 ordinal |          skuId
---------+--------------------------
       1 | 5bc87ae20d298a283c297ca1
       2 | 182784738484wefhdchs4848
(2 rows)

相关内容

  • 没有找到相关文章

最新更新