我想使用grep
在文件中搜索匹配的字符串,但由于文件太大,我只搜索前500行。
我在shell脚本中写道:
#!/bin/bash
patterns=(
llc_prefetcher_operat
to_prefetch
llc_prefetcher_cache_fill
)
search_file_path="mix1-bimodal-no-bop-lru-4core.txt"
echo ${#patterns[*]}
cmd="head -500 ${search_file_path} | grep -a "
for(( i=0;i<${#patterns[@]};i++)) do
cmd=$cmd" -e ""${patterns[i]}"
done;
echo $cmd
$cmd >junk.log
运行脚本的结果是:
3
head -500 mix1-bimodal-no-bop-lru-4core.txt | grep -a -e "llc_prefetcher_operat" -e "to_prefetch" -e "llc_prefetcher_cache_fill"
head: invalid option -a
Try'head --help' for more information.
在倒数第二行,我打印出了已执行命令的字符串。我直接在命令行上运行它,它很成功。这是下面的一句话。
head -500 mix1-bimodal-no-bop-lru-4core.txt | grep -a -e "llc_prefetcher_operat" -e "to_prefetch" -e "llc_prefetcher_cache_fill"
请注意,在grep
命令中,如果我不添加-a
选项,则会出现matching the binary file
的问题。
为什么会出现这个问题?非常感谢。
与其试图构建一个包含复杂命令的字符串,不如使用grep
的-f
选项和bash
进程替换来传递要搜索的模式列表:
head -500 "$search_file_path" | grep -Faf <(printf "%sn" "${patterns[@]}") > junk.log
它更短、更简单、更不容易出错。
(我在grep
选项中添加了-F
,因为您的示例模式中没有任何正则表达式元字符;因此固定字符串搜索可能会更快(
您所做的最大问题是,当$cmd
是单词拆分时,|
被视为head
的另一个参数。它不像存在文字分隔符时那样被视为管道分隔符。