将一些带有值阵列的键加载到猪中



我有以下键值形式的一些数据,我需要加载到猪中。

{"California":["NJ","Seattle","NY"],"NJ":["California","Seattle","NY"],"NY":["NJ","Seattle","California"],"Seattle":["NJ","California","NY"]}

此数据被一行获取。最终,我需要能够作为猪中的键和一系列值访问键。

我尝试使用JSONLOADER,ElephantBird Json Loader加载此数据,但它一直返回空白而不是数据。

请帮助。

JSONLOADER期望与您所拥有的不同。您的数据集有多大?如果不是那么大,最好写一个简单的python/java udf,该python/java udf占用了整个json string,可以转换成一袋所需的元组。在您的猪脚本中,只需致电此udf并在其返回的袋子上调用FLATTEN

最新更新