如何使用pyspark读取excel xlsx文件



我的要求是使用Pyspark读取excel,同时执行同样的操作,得到以下错误。

或者,有没有使用Pandas读取excel并转换为Pyspark数据帧的解决方案?任何人都可以。

lat_data=spark.read.format('com.crealytics.spark.excel'(.option("header","true"(.load("a1.xlsx"(

错误:Py4JJavaError:调用o756.load时出错。:java.lang.ClassNotFoundException:找不到数据源:com.crealytics.spark.excel.

提前谢谢。

您需要安装crealytics库。你可以通过pip:

pip install xlrd

最新更新