Google Refine:遍历JSON字典



我在Google Refine中有一些JSON - 完整版 http://mapit.mysociety.org/point/4326/0.1293497,51.5464828,但缩写如下:

{1234: {'name': 'Barking', 'type': 'WMC'},
 5678: {'name': 'England', 'type': 'EUR'} }

我只想提取具有(假定唯一)类型为 WMC 的对象的名称。

在Google Refine中解析JSON没有帮助,这是使用数组,而不是字典。

有什么建议我应该看什么来解决这个问题吗?


编辑:我不知道初始键是什么:我相信它们是我无法提前预测的唯一标识符。

Refine 目前不知道如何遍历 dict 的键,因为它们的键是未知的(尽管我即将实现该功能)。

使其与当前实现一起使用的诀窍是将 JSON 对象转换为 JSON 数组。 以下 GREL 表达式将执行此操作,将结果解析为 JSON,遍历数组的所有元素并为您提供类型为"WMC"的名字。

filter(('['+(value.replace(/"[0-9]+":/,""))[1,-1]+']').parseJson(),v,v['type']=='WMC')[0]['name']

将该表达式与"基于此列添加列"命令一起使用,以创建新的 WMC 名称列。 如果有可能有多个这种类型的名称,并且您想要所有名称,则可以添加 forEach 循环并沿以下行连接

forEach(filter(('['+(value.replace(/"[0-9]+":/,""))[1,-1]+']').parseJson(),v,v['type']=='WMC'),x,x['name']).join('|')

这将为您提供一个管道分隔的名称列表,您可以使用"拆分多值单元格"将其拆分。

希望在下一个版本中会更容易!

最新更新