我试图在Databricks上使用Modin并获得此错误
我试过pip install modin[all]
和pip install modin[ray]
首先,安装需要15分钟,这很奇怪。
安装后,我正在做
import modin.pandas as md
df = md.read_parquet('s3://path/to/file')
得到这个错误
ModuleNotFoundError: No module named 'ray'
我也试过设置os.environ["MODIN_ENGINE"] = "ray"
我按照下面的步骤使用Ray执行引擎安装Modin。安装Modin依赖项和Ray以在Ray上运行-
pip install modin[ray]
另外,请使用以下命令自定义您的Ray环境以在Modin中使用。
import ray
ray.init()
import modin.pandas as pd
请查看Modin的Intel发行版(https://www.intel.com/content/www/us/en/developer/tools/oneapi/distribution-of-modin.html#gs.14j7r0)和Modin官方页面(https://modin.readthedocs.io/en/stable/)以了解安装问题,并加快pandas在Intel架构上的工作流程。
Try
pip install ray
可能这将帮助你。