根据Rpy2文档,可以使用上下文管理器来实现与Pandas/R的转换。然而,应该如何在上下文管理器中为公式设置环境?例如,以下失败:
import numpy as np
import pandas as pd
import rpy2.robjects as robjs
import rpy2.robjects.conversion as cv
from rpy2.robjects.packages import importr
from rpy2.robjects import pandas2ri, Formula
r_mass = importr("MASS")
r_stats = importr("stats")
# From MASS dose.p example
ldose = pd.Series(np.concatenate((np.arange(1, 6), np.arange(1, 6))))
numdead = pd.Series(np.array([1, 4, 9, 13, 18, 20, 0, 2, 6, 10, 12, 16]))
sex = pd.Series(np.repeat(["M", "F"], [6, 6]))
SF = pd.DataFrame(np.column_stack((numdead, 20 - numdead)),
columns=["numdead", "numalive"])
glm_fmla = Formula("SF ~ sex + ldose - 1")
with cv.localconverter(robjs.default_converter + pandas2ri.converter):
glm_fmla.environment["SF"] = SF
glm_fmla.environment["sex"] = sex
glm_fmla.environment["ldose"] = ldose
budworm_lg0 = robjs.r.glm(glm_fmla, family=r_stats.binomial)
带有消息:
RRuntimeError: Error in model.frame.default(formula = SF ~ sex + ldose - 1, drop.unused.levels = TRUE) :
invalid type (list) for variable 'SF'
使用rpy2 3.3.6和Linux上的最新R版本。任何建议都将不胜感激。
由R生成的RRuntimeError
中继错误及其相关消息类型的异常。这里,调用的R代码(glm()
及其调用的其他R代码(以抱怨SF
的值是Rlist
并且这是不兼容的类型结束。
在R中,data.frame
对象继承自list
,因此这可能真正表明R代码不接受像因变量那样的数据。
我们可以检查SF
:的值的类型
>>> tuple(glm_fmla.environment['SF'].rclass)
('data.frame',)
转换的目标类型似乎是正确的。我们将pandas.DataFrame
转换为Rdata.frame
。
函数MASS::dose.p()
的R示例定义SF
如下:
numdead <- c(1, 4, 9, 13, 18, 20, 0, 2, 6, 10, 12, 16)
SF <- cbind(numdead, numalive = 20 - numdead)
这不是data.frame
:
> class(SF)
[1] "matrix"
你的代码可以这样修改:
r_base = importr('base')
with cv.localconverter(robjs.default_converter + pandas2ri.converter):
glm_fmla.environment["SF"] = base.as_matrix(SF)
glm_fmla.environment["sex"] = sex
glm_fmla.environment["ldose"] = ldose
budworm_lg0 = robjs.r.glm(glm_fmla, family=r_stats.binomial)
注意:您的示例现在使用失败
Error in model.frame.default(formula = SF ~ sex + ldose - 1, drop.unused.levels = TRUE) :
variable lengths differ (found for 'ldose')
通过确保ldose
和SF
具有相同数量的观测值(10或12(,您可以很容易地修复它:
>>> len(ldose)
10
>>> SF.shape
(12, 2)