在通过pip进行部署时,我们如何找到PySpark的所有额外依赖项



我正试图使用上的指令在本地部署PySpark

https://spark.apache.org/docs/latest/api/python/getting_started/install.html#using-pypi

我可以看到额外的依赖项是可用的,例如可以使用部署的sql和pandas_on_spark

pip install pyspark[sql,pandas_on_spark]

但是,我们如何才能找到所有可用的附加功能?

查看pyspark包的json(基于https://wiki.python.org/moin/PyPIJSON)

https://pypi.org/pypi/pyspark/json

我找不到可能的额外依赖项(如pypi依赖项中的"额外依赖项是什么?"中所述(;requiresdist的值为null。

非常感谢你的帮助。

据我所知,您不容易获得额外的列表。如果这个列表没有明确记录,那么您将不得不查看打包的代码/config。在这种情况下,此处给出以下列表:mlmllibsqlpandas_on_spark

最新更新