我在清理事务时遇到了问题。我有一个excel,记录了客户做的每一笔交易,记录了这个行业的数字、光泽和代码。我将这个excel转换为以";"分隔的文本,然后我只需要清理光泽并再次将其转换回excel。
tolower(tabla1)
lapply(tabla1, tolower)
tabla1[] <- lapply(tabla1, tolower)
str(tabla1)
tabla1
tabla1_texto <- gsub("[.]", "", tabla1)
table1_texto <- gsub("[(]", " ", tabla1_texto)
我知道我需要使用gsub()
,但我不确定如何使用它,另一方面,有人知道如何做一个正确的字典,只保留某些单词,删除其他单词吗?
如果你有一个像这样的字符串:
string <- "Some text here; and some text here; and some more text here"
然后可以删除第一个;
之后的所有内容:
gsub(";.*$", "", string)
[1] "Some text here"
将""
替换为;,*$
的说明(空字符串):
- 以
;
开头 - 任意字符
.
0次或0次以上*
- 直到行尾
$
如果您有一个表-您将不得不为每一行单独执行此操作