SQL选择查询不使用R中的SQLDF软件包工作



这就是我数据框的头部的样子

head(d7)
Jurisdiction  %_TOT2030 %_ENR2030  %_RE2030  %_OFF2030  %_OTH2030  %_HH2030
1 Baltimore City  7.6667589         0  7.773109  7.5530587  7.6866764  4.783365
2 Baltimore City  8.0038573         0  8.193277  7.9555175  7.9553903  6.583851
3 Baltimore City 35.4085603         0 37.037037 35.3146853 35.3608247 20.008643
4 Baltimore City  0.5071851         0  1.030928  0.4424779  0.6410256 28.629032
5 Baltimore City  7.5310559         0  8.108108  7.4790458  7.4634938  9.679767
6 Baltimore City 11.8785976         0 12.043011 11.8718593 11.8460613  9.690331

数据框的数据类型如下 str(d7)

'data.frame':   1588 obs. of  7 variables:
 $ Jurisdiction: Factor w/ 59 levels "Accomack County",..: 7 7 7 7 7 7 7 7 7 7 ...
 $ %_TOT2030   : num  7.667 8.004 35.409 0.507 7.531 ...
 $ %_ENR2030   : num  0 0 0 0 0 0 0 0 0 0 ...
 $ %_RE2030    : num  7.77 8.19 37.04 1.03 8.11 ...
 $ %_OFF2030   : num  7.553 7.956 35.315 0.442 7.479 ...
 $ %_OTH2030   : num  7.687 7.955 35.361 0.641 7.463 ...
 $ %_HH2030    : num  4.78 6.58 20.01 28.63 9.68 ...

当我运行以下查询时,它只是在不进行任何更改的情况下返回我的D7,我不明白为什么!

d8 <- sqldf("Select * from d7 where '%_TOT2030' > 10")

在sql查询中您可以使用双引号包围包含空格或特殊字符的字段名称,而单引号表示文本。

这里将文本'%_TOT2030''10'进行了比较。这始终是TRUE,因此您可以从桌子上获得所有行。

要比较字段%_TOT2030的值,您必须编写"%_TOT2030" > 10,因此,我建议您简单地将所有简单和双引号倒数倒数:

d8 <- sqldf('Select * from d7 where "%_TOT2030" > 10')

在sqlite中, sqldf的默认方言,您也可以使用方括号来包装表/列别名以逃避空格,特殊字符和保留的单词。

d8 <- sqldf('Select * from d7 where [%_TOT2030] > 10')

最新更新