逐行提取文件中出现的字符

  • 本文关键字:字符 提取 文件 逐行 bash
  • 更新时间 :
  • 英文 :


我有一个大的双语词典文件,格式为:

abatement: disminucion; mitigacion; moderacion; rebaja; deduccion; supresion; anulacion

我想找出哪一行有最多的翻译单词,所以我想找到;出现最多的行,然后回显英语单词。

我已经设法得到了一些接近的东西,但它使用了sed来修剪数据,这意味着我无法将英语单词匹配回行。

任何想法?

awk -F'[:;]' '{if(NF>n){n=NF;w=$1}}END{print w}' filename

;作为字段分隔符,;所在行将具有最多的字段。

while IFS=';' read -a fields; do
    n=${#fields[@]}
    if (( n > max )); then
       max=$n
       english=${fields[0]%:}
    fi
done < file.txt
echo "$english"

最新更新