合并多个JSON文件，并解析为CSV

我有大约100个JSON文件，所有的标题与不同的日期，我需要合并成一个CSV文件，有标题"日期"real_name"， "文本"

JSON本身没有列出日期，real_name是嵌套的。我有一段时间没有使用JSON了，我有点迷路了。

JSON的基本结构大致如下:

文件名:2021 - 01 - 18. - json

[
{
"client_msg_id": "xxxx",
"type": "message",
"text": "THIS IS THE TEXT I WANT TO PULL",
"user": "XXX",
"user_profile": {
"first_name": "XXX",
"real_name": "THIS IS THE NAME I WANT TO PULL",
"display_name": "XXX",
"is_restricted": false,
"is_ultra_restricted": false
},
"blocks": [
{
"type": "rich_text",
"block_id": "yf=A9",
}
]
}
]

目前我有

import glob 
read_files = glob.glob("*.json")
output_list = []
all_items = []
for f in read_files:
with open(f, "rb") as infile:
output_list.append(json.load(infile))
data = {}
for obj in output_list[]
data['date'] = f
data['text'] = 'text'
data['real_name'] = 'real_name'
all_items.append(data)

读取JSON对象后，只需将数据索引到字典中。你可能需要obj[0]['text']等，如果你的JSON数据真的是在每个文件的列表中，但这似乎很奇怪，我假设你的数据是从output_list粘贴后，你收集的数据。假设你的文件内容如下所示:

{
"client_msg_id": "xxxx",
"type": "message",
"text": "THIS IS THE TEXT I WANT TO PULL",
"user": "XXX",
"user_profile": {
"first_name": "XXX",
"real_name": "THIS IS THE NAME I WANT TO PULL",
"display_name": "XXX",
"is_restricted": false,
"is_ultra_restricted": false
},
"blocks": [
{
"type": "rich_text",
"block_id": "yf=A9",
}
]
}

test.py:

import json
import glob 
from pathlib import Path
read_files = glob.glob("*.json")
output_list = []
all_items = []
for f in read_files:
with open(f, "rb") as infile:
output_list.append(json.load(infile))
data = {}
for obj in output_list:
data['date'] = Path(f).stem
data['text'] = obj['text']
data['real_name'] = obj['user_profile']['real_name']
all_items.append(data)
print(all_items)

输出:

[{'date': '2021-01-18', 'text': 'THIS IS THE TEXT I WANT TO PULL', 'real_name': 'THIS IS THE NAME I WANT TO PULL'}]

相关内容

最新更新

热门标签：