因此,如果您在我试图监视的盒子上本地运行此命令:
df -Ph | awk '0+$5 >= 70 {print}'
它返回所有超过70%阈值的文件系统。
在我的shell脚本中,我正在尝试:
set -x
SPACE70=$(df -Ph | awk '0+$5 >= 70 {print}')
if [ "$SPACE70" != "" ]; then
msg_text="WARNING $HOST has a File system above threshold $SPACE70 "
result=$STATE_WARNING
fi
即使文件系统已经超过70,Space70
也不存储任何内容…可以在本地工作,但不能远程工作。对于上下文,我计划在Nagios上运行它,并通过SSH远程登录到盒子中。
有什么想法吗?我尝试了另一种编辑,但没有帮助:
COMMAND="df -Ph "
SPACE_REPORT=`/usr/local/nagios/sshpass-1.05/sshpass -p$PASS ssh -q -o StrictHostKeyChecking=no -o ConnectTimeout=310 $USER@$HOST "$COMMAND"`
# Set default to OK
result=$STATE_OK
SPACE85=0
SPACE95=0
#
set -x
#AWK FOR WARNING:
SPACE85=$($SPACE_REPORT | awk '0+$5 >= 70 {print}')
if [ "$SPACE85" != "" ]; then
msg_text="WARNING $HOST has a File System above threshold $SPACE85 "
result=$STATE_WARNING
fi
您只是在代码的第10行中缺少了一个echo和引号,该行调用awk:
#AWK FOR WARNING:
SPACE85=$($SPACE_REPORT | awk '0+$5 >= 70 {print}')
应为:
#AWK FOR WARNING:
SPACE85=$(echo "$SPACE_REPORT" | awk '0+$5 >= 70 {print}')
我测试了它,它可以远程工作。
希望能有所帮助!
如果我可以建议,
SPACE70=$(df -Ph | awk '0+$5 >= 70 {N++} END {print 0 + N}')
if [ $SPACE70 -gt 0 ]
我看不出你的第一个版本有什么特别的问题,只是它做的工作比必要的多。
在远程执行时,我会怀疑PATH问题。因为没有调用交互式shell,所以很容易假设初始化实际上没有发生。此外,我对sshpass一无所知,但你确定你看到的是标准错误消息吗?如果没有,这也许可以解释这个谜。
我看到了您的命令并理解了问题。现在我发布我的解决方案版本。
因此,据我所知,您希望检查远程主机或多台主机上的磁盘空间,如果磁盘空间超过70%,请生成警报。如果我的理解不正确,请纠正我。
在我们看到脚本之前,让我们看看输出:
%_Host@User:/home/Gaurava/study> ./fscheck.sh
==========[192.168.246.132 STARTS]==========
[ **ALERT** (192.168.246.132) has FS above THRESHOLD ---vmhgfs-fuse 224G 182G 42G 82% /mnt/hgfs--- ]
[ **ALERT** (192.168.246.132) has FS above THRESHOLD ---/dev/sda1 497M 376M 122M 76% /boot--- ]
==========[192.168.246.132 ENDS]==========
==========[192.168.246.137 STARTS]==========
[ **ALERT** (192.168.246.137) has FS above THRESHOLD ---.host:/ 224G 182G 42G 82% /mnt/hgfs--- ]
==========[192.168.246.137 ENDS]==========
%_Host@User:/home/Gaurava/study>
在上面的输出中,脚本逐个登录到2个远程主机,然后执行命令检查磁盘空间,发现有3个文件系统超过了指定的限制。所以它产生了警报。
脚本:
#!/bin/bash
# Define your command, host/s and user/s.
command='df -Ph'
host1=192.168.246.132
host2=192.168.246.137
user=gaurav
# Main loop STARTS
for h in $host1 $host2
do
# This line can be removed.
echo "==========[$h STARTS]=========="
# Here you can replace this with your sshpass command.
# I am feeding the command output to a while loop to read
# the output line by line, for each of the host/s.
ssh $user@$h "$command" | while read line
do
# Now we check, if the disk space output contains anything
# which matches value greater than 70%, thats it! and
# generate alert.
if [[ $line =~ .*7[1-9]%.* || $line =~ .*[89][0-9]%.* ]]
then
# If above 'if' statement is TRUE, It generates ALERT
# in the below format. '$line' is the variable holding
# info about the file system breaching the threshold.
echo "[ **ALERT** ($h) has FS above THRESHOLD ---$line--- ]"
elif [[ $line =~ .*100% ]]
then
echo "[ **ALERT** ($h) FS reached 100% ---$line--- ]"
fi
done
# This line can be removed.
echo "==========[$h ENDS]==========" ; echo
done
# Main loop ENDS.
我的脚本没有使用与您尝试使用的完全相同的逻辑,但它在类似的逻辑上工作,并使用了几个循环,这简化了我们的问题,并提供了更好的控制
我希望这有助于解决你的问题。如果有什么好处,请告诉我!
编辑:在if循环中添加了一个else部分。尽管当我检查时,如果已经达到100%,它会忽略任何FS,但添加警告/通知不会造成任何危害。这确实是个好主意。
第2版:用一个条件更新了if循环,并添加了100%的echo。后来我意识到前面的循环与数字71,81,91不匹配。