如何将 Spark 数据帧写入 xml 文件



Sample :

scala> Frame.show()
|year| make|model|             comment|blank|
|2012|Tesla|    S|          No comment|    R|
|1997| Ford| E350|Go get one now th...|    L|
|2015|Chevy| Volt|                 Try|    M|

<item>
    <'year'>2012<'/year'>
    <'make'>Tesla<'/make'>
    <'model'>S<'/mode'>
</item>

最简单的方法是使用spark-xml的XML编写器:

val path: String = ???
df.write.format("com.databricks.spark.xml")
  .option("rootTag", "items")
  .option("rowTag", "item")
  .save(path)

如果由于某种原因它不符合您的需求,您可以单独转储记录并saveAsTextFile

def dumpXML(row: Row): String = ???
df.rdd.map(dumpXML).saveAsTextFile(path)

您可以使用例如mapPartitions添加根元素。

相关内容

  • 没有找到相关文章

最新更新