如何从 R 中变量的开头和结尾删除许多字符?



我想从数据框的列中的每个值中删除特定数量的字符,包括数据框中值的开头和结尾,并返回一个新的数据框,其中只有所有单元格值中的特定信息。换句话说:我想保留每个单元格值中的信息的特定部分。我的单元格值由大写和小写字母、数字、特殊字符短划线 (-(、冒号 (:)、分号 (;) 和引号 ("( 组成。例如:

1A2b-3c4d5e6:f7g-8h;9i10j"11k12"l13m;IWouldLikeToKeepThis;14n15o16P17q18r19s-20t21U2;2v23w24"x25y-26z-27

应该成为

IWouldLikeToKeepThis

我想保留的内容前面的字符数是固定的(37 个字符(。我想保留的部分的字符数也是固定的(20个字符(。但是,我想保留的部分后面的字符数不是固定的(多个字符(。

您可以使用substr/substring,因为字符数是固定的。

string <- '1A2b-3c4d5e6:f7g-8h;9i10j"11k12"l13m;IWouldLikeToKeepThis;14n15o16P17q18r19s-20t21U2;2v23w24"x25y-26z-27'
substr(string,38,57)
#[1] "IWouldLikeToKeepThis"

或与substring.

substring(string,38,57)

最新更新