在 R 中操作文本输入 闪亮



我对R相对较新,对Shiny更陌生(字面意思是第一天(。

我希望用户输入多个用逗号分隔的短语,例如female, aged, diabetes mellitus.我有一个数据帧,其中有一个变量MH2包含文本单词。我想输出一个数据帧,该数据帧仅包含所有输入短语所在的行。有时用户可能只输入一个短语,有时输入 5 个短语。

这是我的用户界面。R

library(shiny)
library(stringr)
# load dataset
load(file = "./data/all_cardiovascular_case_reports.Rdata")
ui <- fluidPage(
sidebarLayout(
sidebarPanel(
textInput(inputId = "phrases", 
label = "Please enter all the MeSH terms that you would like to search, each separated by a comma:",
value = ""),
helpText("Example: female, aged, diabetes mellitus")
),
mainPanel(DT::dataTableOutput("dataframe"))
)
)

这是我的服务器。R

library(shiny)
server <- function(input, output)
{
# where all the code will go
df <- reactive({
# counts how many phrases there are
num_phrases <- str_count(input$phrases, pattern = ", ") + 1
a <- numeric(num_phrases) # initialize vector to hold all phrases
# create vector of all entered phrases
for (i in 1:num_phrases)
{
a[i] <- noquote(strsplit(input$phrases, ", ")[[i]][1])
}
# make all phrases lowercase
a <- tolower(a)
# do exact case match so that each phrase is bound by "\b"
a <- paste0("\b", a, sep = "")
exact <- "\b"
a <- paste0(a, exact, sep = "")
# subset dataframe over and over again until all phrases used
for (i in 1:num_phrases)
{
final <- final[grepl(pattern = a, x = final$MH2, ignore.case = TRUE), ]
}
return(final)
})
output$dataframe <- DT::renderDataTable({df()})
}

当我尝试运行renderText({num_phrases})时,即使我会输入多个以逗号分隔的短语,我也总是1。从那以后,每当我尝试输入多个短语时,我都会遇到"错误:下标越界"。但是,当我输入仅用逗号分隔的单词与逗号和空格分隔的单词(输入"女性,老年"而不是"女性,老年"(时,该问题消失了,但我的数据帧没有正确子集。它只能子集一个短语。

请指教。

谢谢。

我认为您的闪亮逻辑看起来不错,但是用于子集化数据帧的函数有几个小问题。特别:

a[i] <- noquote(strsplit(input$phrases, ", ")[[i]][1])

索引[[i]]1在这里的位置错误,应该[[1]][i]

final <- final[grepl(pattern = a, x = final$MH2, ignore.case = TRUE), ]

你不能像这样匹配多个模式,只会使用 a 的第一个元素,这也是 R 给出的警告。


示例工作代码

我已在此处将input$phrases更改为inp_phrases。如果这个脚本做了你想要的,我认为你可以很容易地把它复制到你的反应式中,进行必要的更改(即将inp_phrases改回来,并添加return(result)语句(。我也不完全清楚您是否希望在一行内匹配所有模式,或者返回所有行是否匹配任何模式,所以我将它们都添加了,您可以取消注释您需要的模式:

library(stringr)
# some example data
inp_phrases = "ab, cd"
final = data.frame(index = c(1,2,3,4),MH2 = c("ab cd ef","ab ef","cd ef ab","ef gx"),stringsAsFactors = F)
# this could become just two lines:
a <- sapply(strsplit(inp_phrases, ", ")[[1]],  function(x) tolower(noquote(x)))
a <- paste0("\b", a, "\b") 
# Two options here, uncomment the one you need.
# Top one: match any pattern in a. Bottom: match all patterns in a
# indices = grepl(pattern = paste(a,collapse="|"), x = final$MH2, ignore.case = TRUE)
indices = colSums(do.call(rbind,lapply(a, function(x) grepl(pattern = x, x = final$MH2, ignore.case = TRUE))))==length(a)
result <- final[indices,]

返回:

index      MH2
1     1 ab cd ef
3     3 cd ef ab

。使用第二版索引(全部匹配(或

index      MH2
1     1 ab cd ef
2     2    ab ef
3     3 cd ef ab

。使用索引的第一个版本(匹配任何(

希望这有帮助!

相关内容

  • 没有找到相关文章

最新更新