我有包含图像名称和地面真值的labels.json
文件。由于库的变化,我必须修改json
文件内的数据
Json内
{"자랑스럽다_2730052.jpg": "자랑스럽다", "만족스럽다_1299150.jpg": "만족스럽다"}
我想生成一个labels.csv
文件,其中包含filename
列和words
列,labels.csv
的格式如下。
filename words
2730052.jpg 자랑스럽다
我怎么能做到呢?
您可以创建像{colname:[...]}
这样的字典并将其转换为dataframe,将文本替换为r'.+_'
然后保存到csv文件
json = {"자랑스럽다_2730052.jpg": "자랑스럽다", "만족스럽다_1299150.jpg": "만족스럽다"}
df = pd.DataFrame({'filname': json.keys(), 'words': json.values()})
df['filname'] = df['filname'].replace(r'.+_', '', regex=True)
df.to_csv('labels.csv', index=False)
p>filname words
0 2730052.jpg 자랑스럽다
1 1299150.jpg 만족스럽다