我用过:
tr -dc [:alpha:] < $fileDoc | wc -c
要计算所有字母,
tr -dc ' ' < $fileDoc | wc -c
要计算所有空格,
tr -dc 'n' < $fileDoc | wc -c
以计算文本文档中的所有新行。
我现在想做的是现在计算文档中的所有其他字符,因为我将调用其他所有字符。
以下是文档中的文本:
您好,这是一个测试文本文档。
123
!@#
有没有办法删除找到的所有[:alpha:]
、[:alnum:]
和剩余字符?
这应该可以解决问题
tr -d '[:alpha:] n' < $fileDoc | wc -c
或者,如果您想在空白的定义中包含制表符
tr -d '[:alpha:][:space:]' < $fileDoc | wc -c
根据 OP 的注释,要删除字母、空格、数字和换行符并计算所有剩余字符:
tr -d '[:alnum:][:space:]' < $fileDoc | wc -c
[:space:]
说明字母和数字的字母。 awk
处理所有空格,包括换行符
只是在这里发布以供参考,如果您希望一次性完成所有操作,那么这个CC_6脚本应该可以工作:
awk -v FS='' '
{
for(i=1; i<=NF; i++) {
if($i ~ /[a-zA-Z]/) {alpha++};
if($i == " ") {space++};
if($i !~ /[A-Za-z0-9 ]/) {spl++}
}
}
END {
printf "Space=%s, Alphabets=%s, SplChars=%s, NewLines=%sn", space, alpha, spl, NR
}' file
$ cat file
This is a text
I want to count
alot of $tuff
in 1 single shot
$ awk -v FS='' '
{
for(i=1; i<=NF; i++) {
if($i ~ /[a-zA-Z]/) {alpha++};
if($i == " ") {space++};
if($i !~ /[A-Za-z0-9 ]/) {spl++}
}
}
END {
printf "Space=%s, Alphabets=%s, SplChars=%s, NewLines=%sn", space, alpha, spl, NR
}' file
Space=11, Alphabets=45, SplChars=1, NewLines=4