设置R公式环境和转换上下文管理器



根据Rpy2文档,可以使用上下文管理器来实现与Pandas/R的转换。然而,应该如何在上下文管理器中为公式设置环境?例如,以下失败:

import numpy as np
import pandas as pd
import rpy2.robjects as robjs
import rpy2.robjects.conversion as cv
from rpy2.robjects.packages import importr
from rpy2.robjects import pandas2ri, Formula
r_mass = importr("MASS")
r_stats = importr("stats")
# From MASS dose.p example
ldose = pd.Series(np.concatenate((np.arange(1, 6), np.arange(1, 6))))
numdead = pd.Series(np.array([1, 4, 9, 13, 18, 20, 0, 2, 6, 10, 12, 16]))
sex = pd.Series(np.repeat(["M", "F"], [6, 6]))
SF = pd.DataFrame(np.column_stack((numdead, 20 - numdead)),
columns=["numdead", "numalive"])
glm_fmla = Formula("SF ~ sex + ldose - 1")

with cv.localconverter(robjs.default_converter + pandas2ri.converter):
glm_fmla.environment["SF"] = SF
glm_fmla.environment["sex"] = sex
glm_fmla.environment["ldose"] = ldose
budworm_lg0 = robjs.r.glm(glm_fmla, family=r_stats.binomial)

带有消息:

RRuntimeError: Error in model.frame.default(formula = SF ~ sex + ldose - 1, drop.unused.levels = TRUE) : 
invalid type (list) for variable 'SF'

使用rpy2 3.3.6和Linux上的最新R版本。任何建议都将不胜感激。

由R生成的RRuntimeError中继错误及其相关消息类型的异常。这里,调用的R代码(glm()及其调用的其他R代码(以抱怨SF的值是Rlist并且这是不兼容的类型结束。

在R中,data.frame对象继承自list,因此这可能真正表明R代码不接受像因变量那样的数据。

我们可以检查SF:的值的类型

>>> tuple(glm_fmla.environment['SF'].rclass)
('data.frame',)

转换的目标类型似乎是正确的。我们将pandas.DataFrame转换为Rdata.frame

函数MASS::dose.p()的R示例定义SF如下:

numdead <- c(1, 4, 9, 13, 18, 20, 0, 2, 6, 10, 12, 16)
SF <- cbind(numdead, numalive = 20 - numdead)

这不是data.frame:

> class(SF)
[1] "matrix"

你的代码可以这样修改:

r_base = importr('base')
with cv.localconverter(robjs.default_converter + pandas2ri.converter):
glm_fmla.environment["SF"] = base.as_matrix(SF)
glm_fmla.environment["sex"] = sex
glm_fmla.environment["ldose"] = ldose
budworm_lg0 = robjs.r.glm(glm_fmla, family=r_stats.binomial)

注意:您的示例现在使用失败

Error in model.frame.default(formula = SF ~ sex + ldose - 1, drop.unused.levels = TRUE) : 
variable lengths differ (found for 'ldose')

通过确保ldoseSF具有相同数量的观测值(10或12(,您可以很容易地修复它:

>>> len(ldose)
10
>>> SF.shape
(12, 2)

最新更新