我想从数据框的列中的每个值中删除特定数量的字符,包括数据框中值的开头和结尾,并返回一个新的数据框,其中只有所有单元格值中的特定信息。换句话说:我想保留每个单元格值中的信息的特定部分。我的单元格值由大写和小写字母、数字、特殊字符短划线 (-(、冒号 (:)、分号 (;) 和引号 ("( 组成。例如:
1A2b-3c4d5e6:f7g-8h;9i10j"11k12"l13m;IWouldLikeToKeepThis;14n15o16P17q18r19s-20t21U2;2v23w24"x25y-26z-27
应该成为
IWouldLikeToKeepThis
我想保留的内容前面的字符数是固定的(37 个字符(。我想保留的部分的字符数也是固定的(20个字符(。但是,我想保留的部分后面的字符数不是固定的(多个字符(。
您可以使用substr
/substring
,因为字符数是固定的。
string <- '1A2b-3c4d5e6:f7g-8h;9i10j"11k12"l13m;IWouldLikeToKeepThis;14n15o16P17q18r19s-20t21U2;2v23w24"x25y-26z-27'
substr(string,38,57)
#[1] "IWouldLikeToKeepThis"
或与substring
.
substring(string,38,57)