如何导出Pyspark MLIB机器学习模型并部署为Web服务



i具有使用Spark Mlib的线性回归模型。现在,我想导出模型并通过Web服务使用模型。我正在研究PMML无法找到适当的来源,因为我该如何使用它。我需要安装任何特定的PMML库还是如何完成。

我尝试使用Joblib作为泡菜文件导出的同一模型,并通过烧瓶将其部署为Web服务。我想为Spark Mlib开发的模型做类似的事情。

任何人都可以帮助我或指向我纠正源吗?

对于使用PMML简单的REST Web服务,您可以查看https://github.com/openscoring/openscoring。它使用Java。对于Python 烧瓶,我不知道,但是PMML不过是需要评估的XML文件。因此,您可以尝试编写自己的Python逻辑来完成。我还发现了这https://github.com/maxkferg/pmml-scoring-enengine,但没有太多星星。

虽然PMML的使用情况非常有限。并非所有模型都得到支持,例如ALS。另一种方法是通过其二进制文件部署Pyspark应用程序。我在这里写了这一点。我们使用Cloud Foundry部署了它,但是如果您需要公共端点,也可以使用BuildPack在Heroku上部署它。希望这会有所帮助。