r语言 - 在cut()中嵌套分位数



我正在做一项作业,我被卡住了。我的目的是将数据分成四分位数,根据具体情况分别标记为低、中、高组。Low将设置中的所有数据关联到但不包括销售额的40%分位数断点值。中值是介于低销量和高销量之间。高于85分位数。我正在努力将代码拼接在一起。这是我目前得到的。# EV9(部分)[

sales_cat <- cut(df_XX$sales, breaks = c(quantile(df_XX$sales, probs = seq(0,1,by = .40), na.rm = TRUE)),right = TRUE, ordered = TRUE)

(https://i.stack.imgur.com/owbOz.png)[在这里输入图像描述](https://i.stack.imgur.com/uGvFO.png)

我尝试了上面的代码,我希望得到一个将数据分成三组的结果——在销售标记的40%之前的数据,超过85%的数据和介于40和85标记之间的数据

首先提供一些数据:

set.seed(42)
sales <- sample.int(100, 25, replace=TRUE)

现在设置换行符并创建组:

brks <- quantile(sales, probs=c(0, .4, .85, 1))
grps <- cut(sales, brks, include.lowest=TRUE, labels=c("Low", "Medium", "High"))
table(grps)
# grps
#    Low Medium   High 
#     10     11      4 

最新更新