nginx状态监控统计

nginx是一款很优秀的web服务器软件,很多地方都有接触和使用到他,大部分的场景压力还没达到需要调优的地步,而调优的难点其实不在于调,而在于各项状态的监控,能够很快的找到资源在什么时候出现问题,调整前后出现的变化,如果都不知道变化在哪里所做的调优只能是凭感觉的

之前看到有技术人员用nginx作为rgw的前端的时候,通过优化去实现将nginx的并发提高到很大,而不出现4xx等问题,nginx的access.log里面是有记录访问的状态码的,而这个日志的分析如果是一次次的去看,这样的分析是无法用精确的数据去展示的

最开始的想法是想根据时间点去统计时间点的状态码,后来发现这样做既复杂,又无法输出到一些数据展示软件当中,实际上我只需要统计一定时间的总的状态值,然后定期去取这个值,然后在数据展示的时候,就可以看到一个数值的曲线图,增量即为这个时间区间所产生的状态值

下面就是我的实现,一个脚本就可以统计了,这个是最初的版本,纯统计状态码,还没有区分读写分离的情况,这个在后面会加入分离的情况

#!/bin/sh
#
### BEGIN INIT INFO
# Provides: nginxstatus
# Required-Start: $nginx
# Short-Description: nginxstatus
# Description: collectstatus of nginx
### END INIT INFO
#
#
# pidfile: /var/run/nginx/nginxstatus.pid
#
# Source function library.
##########################################
#状态码一般分为1xx,2xx,3xx,4xx,5xx,total
statucode="2 3 4 5"
##check intervel setting
interval=2
########################################
#check the nginxstatus pid dir if exist
if [ ! -d /var/run/nginxstatus/ ];then
mkdir /var/run/nginxstatus/
fi
##check the status of nginx access
check(){
for code in $statucode
do
echo "$code"xx:`cat /var/log/nginx/access.log |awk '{if( substr($9,0,1) == '''$code''' ) print $9}' |wc -l` > /var/log/nginx/"$code"xx.log
done
sleep $interval
}
#start nginx status
start() {
echo -e Starting nginxstatus: "\033[32m [ OK ] \033[0m"
while [ 2 > 1 ]
do
check

done &
pid=`ps ax | grep -i 'nginxstatus' | head -n 1|awk '{print $1}'`
echo -e pid is "\033[33m $! \033[0m"
echo $! >> /var/run/nginxstatus/nginxstatus.pid
}
#stop nginx
stop() {
echo -e stop nginxstatus collect "\033[32m [ OK ] \033[0m"

pid=`cat /var/run/nginxstatus/nginxstatus.pid 2>/dev/null`
kill -10 $pid 2>/dev/null
#killall nginxstatus
rm -rf /var/run/nginxstatus/nginxstatus.pid
}


status() {
for code in $statucode
do
cat /var/log/nginx/"$code"xx.log
done
}

clean () {
for code in $statucode
do
echo "" > /var/log/nginx/"$code"xx.log
done
echo "" > /var/log/nginx/access.log
echo "clean /var/log/nginx/access.log"
echo -e "clean /var/log/nginx/access.log" "\033[32m [ OK ] \033[0m"
}

case "$1" in
start)
start && exit 0
;;
stop)
stop || exit 0
;;
status)
status
;;
clean)
clean
;;
*)
echo $"Usage: $0 {start|stop|status|clean}"
exit 2
esac
exit $?

使用方法:

1、启动进程

[root@zhongbo ~]# /etc/init.d/nginxstatus start
Starting nginxstatus: [ OK ]
pid is 166534

会生成下面的状态文件,周期为2s一更新
[root@zhongbo ~]# ll /var/log/nginx/*xx.log
-rw-r—r— 1 root root 7 Feb 23 00:25 /var/log/nginx/2xx.log
-rw-r—r— 1 root root 6 Feb 23 00:25 /var/log/nginx/3xx.log
-rw-r—r— 1 root root 7 Feb 23 00:25 /var/log/nginx/4xx.log
-rw-r—r— 1 root root 6 Feb 23 00:25 /var/log/nginx/5xx.log

2、当前nginx的状态查询

[root@zhongbo ~]# /etc/init.d/nginxstatus status
2xx:21
3xx:1
4xx:10
5xx:0

3、停止nginxstatus进程

[root@zhongbo ~]# /etc/init.d/nginxstatus stop
stop nginxstatus collect [ OK ]

4、清理历史数据

[root@zhongbo ~]# /etc/init.d/nginxstatus clean
clean /var/log/nginx/access.log [ OK ]

这个操作会清空/var/log/nginx/access.log日志的内容重新统计

这个会在后期根据需求进行优化