我的json具有字符串格式的结构类型数组。当我尝试在JSON文件中编写同样的错误时,我会遇到以下错误。我将此输出文件用于我的架构验证,并因特殊字符而导致失败。
from pyspark.sql import Row
from pyspark.sql import DataFrame
from pyspark.sql.types import *
import pandas as pd
jsondata1 = '{"activity":[{"activity":"test","activityValue":"1"},{"activity":"test","activityValue":"1"}]}'
my_automatic_schema = json_schema.dumps(jsondata1)
my_automatic_schema
atoDF = sqlContext.read.json(sc.parallelize([my_automatic_schema]))
atoDF.write.format("json").save("mnt//Users/name/test3.json")
我期望以下输出: '{"activity": [{"activityValue": "str", "activity": "str"}, "..."]}'
并在我的JSON中获取以下输出 {"activity":["{"activityValue":"str","activity":"str"}","..."]}
请帮助我提供有关如何摆脱输出文件中特殊字符的解决方案
尝试使用这样的原始字符串:
jsondata1 = r'{"activity":[{"activity":"test","activityValue":"1"},{"activity":"test","activityValue":"1"}]}'