我有一个结构如下的Excel文件:
name age status
anna 35 single
petr 27 married
我已经将这样的文件转换为具有如下结构的嵌套字典:
{'anna': {'age':35}, {'status': 'single'}},
{'petr': {'age':27}, {'status': 'married'}}
使用熊猫:
import pandas as pd
df = pd.read_excel('path/to/file')
df.set_index('name', inplace=True)
print(df.to_dict(orient='index'))
但是现在当运行list(df.keys())
时,它会向我返回字典中所有键的列表("年龄"、"状态"等(,但不会返回"名称"。
我的最终目标是通过键入名称向我返回所有键和值。
有可能吗?或者,也许我应该使用其他方式导入数据以实现目标?最终我应该找到一本字典,因为我会用一个键将它与其他词典合并。
我认为您需要参数drop=False
来set_index
以免删除列Name
:
import pandas as pd
df = pd.read_excel('path/to/file')
df.set_index('name', inplace=True, drop=False)
print (df)
name age status
name
anna anna 35 single
petr petr 27 married
d = df.to_dict(orient='index')
print (d)
{'anna': {'age': 35, 'status': 'single', 'name': 'anna'},
'petr': {'age': 27, 'status': 'married', 'name': 'petr'}}
print (list(df.keys()))
['name', 'age', 'status']
给定来自 excel 的数据帧,您应该这样做来获取您想要的东西:
resulting_dict = {}
for name, info in df.groupby('name').apply(lambda x: x.to_dict()).iteritems():
stats = {}
for key, values in info.items():
if key != 'name':
value = list(values.values())[0]
stats[key] = value
resulting_dict[name] = stats
试试这个:
import pandas as pd
df = pd.read_excel('path/to/file')
df[df['name']=='anna'] #Get all details of anna
df[df['name']=='petr'] #Get all details of petr