小贝子编程

当interschema设置为True时，Pyspark如何自动决定列的数据类型，后台发生了什么? &

本文关键字：后台数据类型发生了何自动设置 interschema True Pyspark 决定 scala apache-spark pyspark apache-spark-sql bigdata
更新时间 : 2023-09-23
英文 : How does Pyspark decides data type of a column automatically when inferschema is set to True, What happens in the background

根据文档，

interschema:自动推断列类型。它需要一个额外的传递数据，默认为false

好的，我理解spark将读取CSV来确定数据类型并相应地分配。

我很想知道后台发生了什么。

谁能帮我更好地理解它或分享一些链接!

谢谢。

回答你的一些问题

相关内容