nagios监控windows openmanage

4473阅读 0评论2013-01-06 split_two
分类:系统运维

这两天在网上找了一些关于nagios监控windows的相关资料,搭建安装过程还是比较简单的,这里我主要介绍一下怎么监控dell的openmanage工具。网上很多关于都是监控linux客户端的openmanage,而监控windows客户端的少之又少,至于openmanage工具的好处就是可以监控机器温度、内存、阵列卡、风扇之类的。这里说下我的步骤:
下面这个截图是安装NSClient++-0.3.8-Win32软件后监控windows客户端的主机存活、cpu使用率、内存使用率、磁盘空间等!
前提条件:
a、这台机器必须是DELL的服务器,比如1950、2950之类的。台式机不可行!
b、必须有这个两个软件,一个是OpenManager.rar,一个是check_openmanage-3.5.8.rar。如果找不到下载的朋友可以联系我!
环境介绍:
监控机是linux系统
被监控机是windows(32位)系统,windows 2003 sp2版本
1、首先把上述的两个软件传到你的被监控上,解压后进入到OpenManager\windows\目录下,点击安装setup.exe应用程序开始安装,安装请选择典型安装,安装路径最好不要修改。安装完后会在c盘生成这个目录Program Files\Dell\SysMgt,安装完后不需要重启机器。
验证:在浏览器上输入https://被监控机IP地址:1311,会提示此网站安全证书有问题,点击继续浏览此网站(不推荐),然后输入登录系统的用户名和密码登录,如果出来以下界面则说明安装成功了!
2、进入到check_openmanage-3.5.8,将check_openmanage.exe文件拷贝到你安装NSClient++-0.3.8-Win32软件后的安装目录,默认是c盘Program Files\NSClient++目录下。
3、修改被监控的NSC.ini文件,增加如下内容到最后4行上面
[NRPE Handlers]
command[check_openmanage]=C:\Program Files\NSClient++\check_openmanage.exe -b ctrl_fw\/ctrl_driver=all -p
4、重启NSClient++服务
5、在监控机测试一下,红色部分是你被监控的IP地址,我这里10秒取不到数据,超时,所以用了-t参数设置为20秒取数据,你的也许不用加后面的-t超时参数。如果得到以下类似的输入,那么恭喜,就差最后一步了。
6、监控机增加监控服务选项,仅供参考!
define service{
          host_name              被监控IP地址
          service_description    check-openmanage
          check_command          check_nrpe!check_openmanage -t 20
          max_check_attempts     5
          normal_check_interval  3
          retry_check_interval   2
          check_period           24x7
          notification_interval  10
          notification_period    24x7
          notification_options   w,u,c,r
          contact_groups         sagroup
          }
7、重启nagios服务测试一下吧!
正常了,固件版本比较低,报了一个警告,其余的正常!
补充:如果要监控linux客户端的话,linux客户端需要部署两个软件参考我的博客链接地址的第五步、第6步。
http://blog.chinaunix.net/uid-23916356-id-3062081.html
最后也是到这篇博客的第6步,监控机增加监控项,记得写成 check_nrpe!check_omsa,因为那篇博客是定义check_omsa的
define service{
          host_name              被监控IP地址
          service_description    check-openmanage
          check_command          check_nrpe!check_omsa
          max_check_attempts     5
          normal_check_interval  3
          retry_check_interval   2
          check_period           24x7
          notification_interval  10
          notification_period    24x7
          notification_options   w,u,c,r
          contact_groups         sagroup
          }
如果遇到部署有问题的朋友欢迎留言给我!
上一篇:hadoop fsck健康检查
下一篇:mysql表故障