我想创建一个由5个随机生成的字符组成的10个"单词"的向量。例如c("ASDT"、"WUIW"…)
目前我正在使用以下脚本,但肯定有更好的方法来完成
result = list()
for (i in 1:10){
result[i]<-paste(sample(LETTERS, 5, replace=TRUE),collapse="")
}
result<-paste(t(result))
我将采样一次,并将结果转换为数据帧,该数据帧可以传递给paste0
:
set.seed(42)
do.call(paste0, as.data.frame(matrix(sample(LETTERS, 50, TRUE), ncol = 5)))
#[1] "XLXTJ" "YSDVL" "HYZKA" "VGYRZ" "QMCAL" "NYNVY" "TZKAX" "DDXFQ" "RMLXZ" "SOVPQ"
您的代码没有任何根本问题,只是使用了循环。
唯一更好的方法是用列表应用程序函数(在本例中为replicate
)代替循环:
replicate(10, paste(sample(LETTERS, 5, replace = TRUE), collapse = ''))
这是stringi
的一个选项
library(stringi)
set.seed(1)
stri_rand_strings(10, 5, '[A-Z]')
#[1] "GJOXF" "XYRQB" "FERJU" "MSZJU" "YFQDG" "KAJWI" "MPMEV" "RUCSK" "VQUON"
#[10] "UAMTS"
我会创建一个自定义函数,比如这个函数,它将接受单词的大小和您想要的单词数量作为返回
WordsGen <- function(n, size){
substring(paste(sample(LETTERS, n * size, replace = TRUE), collapse = ""),
seq(1, (n - 1)*size + 1, size), seq(size, n * size, size))
}
set.seed(1)
WordsGen(10, 5)
## [1] "GJOXF" "XYRQB" "FERJU" "MSZJU" "YFQDG" "KAJWI" "MPMEV" "RUCSK" "VQUON" "UAMTS"