我正在寻找一种方法,如何转储包含numpy数组的嵌套字典到JSON文件(保持我的实验和数据的完整日志在一个地方)。
我的字典看起来像这样(结构可能比显示的代码更嵌套):
import numpy as np
data = {'foo': {'bar': np.array([1, 2, 3])}, 'goo': np.array([3,5,7]),'fur': {'dur': {'mur': np.array([7,5,8])}}}
目前这段代码失败,因为numpy数组是不可序列化的:
with open('data.txt','w') as fl:
json.dump(data,fl)
我知道可以使用tolist()函数,但我不知道如何在保留数据结构和交换np的同时遍历字典。
我尝试使用递归从字典中获取单个值,但我不知道如何"构建字典"。我现在的代码(没有json转储):
import numpy as np
def dict_walk(data):
for k, v in data.iteritems():
if isinstance(v, dict):
dict_walk(v)
else:
l = v.tolist()
print l
data = {'foo': {'bar': np.array([1, 2, 3])}, 'goo': np.array([3,5,7]),'fur': {'dur': {'mur': np.array([7,5,8])}}}
dict_walk(data)
可以给json.dump
一个default
函数;对于JSON不知道如何处理的任何数据类型,它都被调用:
def default(obj):
if isinstance(obj, np.ndarray):
return obj.tolist()
raise TypeError('Not serializable')
with open('data.txt','w') as fl:
json.dump(data, fl, default=default)