pyspark读取json文件作为stringType的一列



我想将JSON文件转换为完整JSON字符串的行列表。我会使用文本格式来读取JSON文件,但这些文件不是换行符分隔的,我不能改变这一点。

输入JSON:

{"key":"value1"},{"key":"value2"}

预期输出:

tbody> <<tr>
record
{"key"value1"
{"key"value2"

您可以尝试使用

df = spark.read.options(lineSep = ",").json(filePathOfJson)

默认为"n">

最新更新