这是我的问题:
如何找到数字所在的直方图仓的索引?
在Matlab中,解决方案很简单。HISTC的工作:
[counts,bin] = histc(data,edges)
"bin"就是我要找的。
但我是在R中工作的,R的hist
函数并没有提出函数性。我想我可以用一些代码行(使用min
和<
之类的东西)进行管理,但由于我需要对许多数字进行管理,我想找到一个更优雅的解决方案。
由于我在R方面不是很有经验,我希望能有一个棘手的解决方案,用另一种方式来解决这个问题。
hist
函数将返回bin之间的断点(如果您还没有)。然后,您可以使用findInterval
函数来查找每个点属于哪个区间/bin:
> tmp <- hist(iris$Petal.Width)
> findInterval(iris$Petal.Width, tmp$breaks)
[1] 2 2 2 2 2 3 2 2 2 1 2 2 1 1 2 3 3 2 2 2 2 3 2 3 2
[26] 2 3 2 2 2 2 3 1 2 2 2 2 1 2 2 2 2 2 4 3 2 2 2 2 2
[51] 7 8 8 7 8 7 9 6 7 7 6 8 6 7 7 7 8 6 8 6 10 7 8 7 7
[76] 7 7 9 8 6 6 6 7 9 8 9 8 7 7 7 7 7 7 6 7 7 7 7 6 7
[101] 13 10 11 10 12 11 9 10 10 13 11 10 11 11 13 12 10 12 12 8 12 11 11 10 11
[126] 10 10 10 11 9 10 11 12 8 7 12 13 10 10 11 13 12 10 12 13 12 10 11 12 10
> tmp2 <- .Last.value
> cbind( value=iris$Petal.Width, lower=tmp$breaks[tmp2], upper=tmp$breaks[tmp2+1])
value lower upper
[1,] 0.2 0.2 0.4
[2,] 0.2 0.2 0.4
[3,] 0.2 0.2 0.4
[4,] 0.2 0.2 0.4
[5,] 0.2 0.2 0.4
[6,] 0.4 0.4 0.6
[7,] 0.3 0.2 0.4
[8,] 0.2 0.2 0.4
[9,] 0.2 0.2 0.4
[10,] 0.1 0.0 0.2
有几个R包(重新)实现了histc
以简化代码移植。例如,
pracma
http://cran.r-project.org/web/packages/pracma/