Modin - ModuleNotFoundError:没有名为"ray"的模块



我试图在Databricks上使用Modin并获得此错误

我试过pip install modin[all]pip install modin[ray]

首先,安装需要15分钟,这很奇怪。

安装后,我正在做

import modin.pandas as md
df = md.read_parquet('s3://path/to/file')

得到这个错误

ModuleNotFoundError: No module named 'ray'

我也试过设置os.environ["MODIN_ENGINE"] = "ray"

我按照下面的步骤使用Ray执行引擎安装Modin。安装Modin依赖项和Ray以在Ray上运行-

pip install modin[ray] 

另外,请使用以下命令自定义您的Ray环境以在Modin中使用。

import ray
ray.init()
import modin.pandas as pd

请查看Modin的Intel发行版(https://www.intel.com/content/www/us/en/developer/tools/oneapi/distribution-of-modin.html#gs.14j7r0)和Modin官方页面(https://modin.readthedocs.io/en/stable/)以了解安装问题,并加快pandas在Intel架构上的工作流程。

Try

pip install ray

可能这将帮助你。

最新更新