使用Ganglia监控系统监控集群(debian)

ganglia是一个集群监控软件,底层使用RRDTool获得数据。
Ganglia分为ganglia-monitor和gmetad两部分,前者运行在集群每个节点上(被监控机器)收集RRDTool产生的数据,后者运行在监控服务器上,收集每个ganglia-monitor的数据,通过Web UI可以看到直观的各种图表。

在debian上安装Ganglia非常简单,首先安装下面三个包。因为要使用Web服务器才能看到图表,所以如果没有安装apache的话,会自动安装apache服务器。

1
2
3
4
5
6
7
apt-get installganglia-monitor  #这个包安装在被监控机器即可
apt-get install ganglia-webfront gmetad #这两个包安装在监控服务器,前者提供web页面,后者收集其他机器的监控数据
```

被监控安装完成之后,gmond服务会运行起来,使用下面的命令可以启动这个服务。
```raw
/etc/init.d/ganglia-monitor restart

(配置文件的路径在/etc/ganglia/gmond.conf)基本不用配置就可以启用

配置监控服务器(展示页面的服务器)

因为ganglia-webfront这个包默认将Web相关的代码安装在”/usr/share/ganglia-webfrontend/”路径下,这样apache访问不到。可以使用软链接或者直接将目录移到”/var/www/”目录下。

1
ln -s /usr/share/ganglia-webfrontend//var/www/ganglia

接着在浏览器输入”http://localhost/ganglia”就可以看到Web UI了

需要监控更多机器的时候,只需要在机器上安装ganglia-monitor 启动服务即可

补充说明:
一、主页的显示的时间为格林威治时间,所以看起来很奇怪,想要显示为本地时间,需要修改提供网页机器的php.ini文件
路径为:/etc/php5/apache2/php.ini

将[Date]下的设置为date.timezone =Asia/Shanghai

重启apache2

1
/etc/init.d/apache2 restart

再看主页,时间变成了当前机器时间

二、python监控插件的扩展
为了确保Ganglia的安装有了Python支持的设置,检查一下以下设置
gmond.conf 有一行 include (“/etc/ganglia/conf.d/*.conf”) ,这是你应该放置.conf格式的python模块配置文件所在的目录。
modpython.conf 这个文件应该存在于/etc/ganglia/conf.d 中,它包含了pyconf文件的所在位置
modpython.so应该在/usr/lib/ganglia中
/usr/lib/ganglia/python_modules这个目录应该存在,这是你放置以.py结尾的python模块文件所在的目录

写于: 2012年08月02日
更新于: 2015年03月22日