我正在做一项作业,我被卡住了。我的目的是将数据分成四分位数,根据具体情况分别标记为低、中、高组。Low将设置中的所有数据关联到但不包括销售额的40%分位数断点值。中值是介于低销量和高销量之间。高于85分位数。我正在努力将代码拼接在一起。这是我目前得到的。# EV9(部分)[
sales_cat <- cut(df_XX$sales, breaks = c(quantile(df_XX$sales, probs = seq(0,1,by = .40), na.rm = TRUE)),right = TRUE, ordered = TRUE)
(https://i.stack.imgur.com/owbOz.png)[在这里输入图像描述](https://i.stack.imgur.com/uGvFO.png)
我尝试了上面的代码,我希望得到一个将数据分成三组的结果——在销售标记的40%之前的数据,超过85%的数据和介于40和85标记之间的数据
首先提供一些数据:
set.seed(42)
sales <- sample.int(100, 25, replace=TRUE)
现在设置换行符并创建组:
brks <- quantile(sales, probs=c(0, .4, .85, 1))
grps <- cut(sales, brks, include.lowest=TRUE, labels=c("Low", "Medium", "High"))
table(grps)
# grps
# Low Medium High
# 10 11 4