我在R中使用BradleyTerry2包时遇到问题。我的数据如下。我从另一个代码创建了数据,我认为格式与BradleyTerry exmple中的"引文.sf"相同(https://cran.r-project.org/web/packages/BradleyTerry2/vignettes/BradleyTerry.pdf)
player1 player2 win1 win2
1 1 2 10 0
2 1 3 10 0
3 1 4 5 5
4 1 5 10 0
5 1 6 9 1
6 2 3 6 4
7 2 4 4 6
8 2 5 5 5
9 2 6 8 2
10 3 4 2 8
11 3 5 7 3
12 3 6 6 4
13 4 5 10 0
14 4 6 9 1
15 5 6 4 6
但是,当我运行speedModel <- BTm(cbind(win1, win2), player1, player2, data = dat)
时,它会显示一条错误消息,如下所示。
Diff错误(player1,player2,formula,id,data,separate.ability,refcat,:'播放器1$..'和"player2$.."必须是具有相同水平的因素
我查看了StackOverflow上的另一个页面(更新了数据:Diff中的错误…必须是具有相同级别的因素(,并尝试了以下代码。(不过我不明白它的作用。(
levels(dat[,1]) <- dat(c(dat[,1], dat[,2]))
levels(dat[,2]) <- dat(c(dat[,1], dat[,2]))
但是,BTm((函数会抛出相同的消息。有人能告诉我我能做什么吗?
以下是dput(dat)
的结果
structure(list(player1 = structure(c(1L, 1L, 1L, 1L, 1L, 2L,
2L, 2L, 2L, 3L, 3L, 3L, 4L, 4L, 5L), .Label = 1:6), player2 = structure(c(2L,
3L, 4L, 5L, 6L, 3L, 4L, 5L, 6L, 4L, 5L, 6L, 5L, 6L, 6L), .Label = 1:6),
win1 = c(10L, 10L, 5L, 10L, 9L, 6L, 4L, 5L, 8L, 2L, 7L, 6L,
10L, 9L, 4L), win2 = c(0L, 0L, 5L, 0L, 1L, 4L, 6L, 5L, 2L,
8L, 3L, 4L, 0L, 1L, 6L)), row.names = c(NA, -15L), class = "data.frame")
您的问题在于数据框架中玩家因素的定义。它们需要具有完全相同的电平,但由于CCD_。。。,5,而player2
包含值2。。。,6那么他们将有不同的水平。
您需要通过提供确切的级别来强制两个因素的级别相同。这里有一种方法,通过创建两个具有正确因子水平的新变量来实现。
dat$p1 <- factor(dat$player1, levels=unique(c(dat$player1, dat$player2)))
dat$p2 <- factor(dat$player2, levels=unique(c(dat$player1, dat$player2)))
然后我们可以运行
> speedModel <- BTm(cbind(win1, win2), p1, p2, data = dat)
> speedModel
Bradley Terry model fit by glm.fit
Call: BTm(outcome = cbind(win1, win2), player1 = p1, player2 = p2,
data = indata)
Coefficients:
..2 ..3 ..4 ..5 ..6
-2.1433 -2.4885 -0.7286 -3.1201 -2.9323
Degrees of Freedom: 15 Total (i.e. Null); 10 Residual
Null Deviance: 81.14
Residual Deviance: 13.71 AIC: 51.6