当前位置: > Linux服务器 > 监控工具 >

Redhat配置nagios-配置linux被监控机

时间:2014-11-06 12:18来源:linux.it.net.cn 作者:IT

配置被监控机

本文讲述的是:Redhat配置nagios。返回大纲。

配置linux被监控机(客户端)

需要先安装gcc、openssl、openssl-devel。

先添加一个用户


  1. [root@localhost ~]# useradd nagios  
  2.  
  3. [root@localhost ~]# passwd nagios //123456  
  4.  

Changing password for user nagios.

New UNIX password:

BAD PASSWORD: it is too simplistic/systematic

Retype new UNIX password:

passwd: all authentication tokens updated successfully.

 

安装nagios-plugins-1.4.15.tar.gz


  1. [root@localhost ~]# tar -zxvf nagios-plugins-1.4.15.tar.gz  
  2.  
  3. [root@localhost ~]# cd nagios-plugins-1.4.15  
  4.  
  5. [root@localhost nagios-plugins-1.4.15]# ./configure --prefix=/usr/local/nagios  
  6.  
  7. [root@localhost nagios-plugins-1.4.15]# make  
  8.  
  9. [root@localhost nagios-plugins-1.4.15]# make install  
  10.  
  11. [root@localhost nagios-plugins-1.4.15]# chown nagios.nagios /usr/local/nagios  
  12.  
  13. [root@localhost nagios-plugins-1.4.15]# chown -R nagios.nagios /usr/local/nagios/libexec  
  14.  

安装nrpe


  1. [root@localhost ~]# tar -zxvf nrpe-2.8b1  
  2.  
  3. [root@localhost ~]# cd nrpe-2.8b1  
  4.  
  5. [root@localhost nrpe-2.8b1]# ./configure  
  6.  
  7. [root@localhost nrpe-2.8b1]# make all  
  8.  
  9. [root@localhost nrpe-2.8b1]# make install-plugin  
  10.  
  11. [root@localhost nrpe-2.8b1]# make install-daemon  
  12.  
  13. [root@localhost nrpe-2.8b1]# make install-daemon-config  
  14.  

编辑nrpe.cfg


  1. [root@localhost ~]# vi /usr/local/nagios/etc/nrpe.cfg  
  2.  

查找如下加上nagios服务器ip地址

allowed_hosts=127.0.0.1,10.155.2.65

保存后,用如下命令启动nrpe和添加到开机启动中


  1. /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg –d  
  2.  
  3. echo '/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d &> /dev/null' >> /etc/rc.local  
  4.  

验证


  1. [root@localhost etc]# /usr/local/nagios/libexec/check_nrpe -H localhost  
  2.  

NRPE v2.8b1


  1. [root@localhost etc]# netstat -atulnp | grep 'nrpe'  
  2.  

tcp 0 0 0.0.0.0:5666 0.0.0.0:* LISTEN 24823/nrpe

如果不正常见文章最后的问题和解决(1)

这里客户端的配置已经完成,已经可以到nagios服务器配置command.cfg监控,但是这里介绍另一种方法在编辑nrpe.cfg配置命令,nagios服务器会调用客户端的nrpe命令


  1. vi /usr/local/nagios/etc/nrpe.cfg  
  2.  
  3. command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10  
  4.  
  5. command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20  
  6.  
  7. command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z  
  8.  
  9. command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200  
  10.  
  11. command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%  
  12.  

下面这条是自己添加


  1. command[check_ping81]=/usr/local/nagios/libexec/check_ping -H 10.155.0.1 -w 100.0,20% -c 500.0,60%#  
  2.  
  3. command[check_hda1]=/usr/local/nagios/libexec/check_disk -w 20 -c 10 -p /dev/hda1  
  4.  
  5. #command[命令名称]=命令定义  
  6.  

具体使用见帮助


  1. [root@localhost nagios]# ls  
  2.  
  3. bin etc include libexec share  
  4.  
  5. [root@localhost nagios]# pwd  
  6.  
  7. /usr/local/nagios  
  8.  
  9. [root@localhost nagios]# libexec/check_ping -h  
  10.  
  11. check_ping v1.4.15 (nagios-plugins 1.4.15)  
  12.  
  13. Copyright (c) 1999 Ethan Galstad  
  14.  
  15. Copyright (c) 2000-2007 Nagios Plugin Development Team  
  16.  
  17. Use ping to check connection statistics for a remote host.  
  18.  

  1. Usage:  
  2.  
  3. check_ping -H -w ,% -c ,%  
  4.  
  5. [-p packets] [-t timeout] [-4|-6]  
  6.  
  7. Options:  
  8.  
  9. -h, --help  
  10.  
  11. Print detailed help screen  
  12.  
  13. -V, --version  
  14.  
  15. Print version information  
  16.  
  17. -4, --use-ipv4  
  18.  
  19. Use IPv4 connection  
  20.  
  21. -6, --use-ipv6  
  22.  
  23. Use IPv6 connection  
  24.  
  25. -H, --hostname=HOST 
  26.  
  27. host to ping  
  28.  
  29. -w, --warning=THRESHOLD 
  30.  
  31. warning threshold pair  
  32.  
  33. -c, --critical=THRESHOLD 
  34.  
  35. critical threshold pair  
  36.  
  37. -p, --packets=INTEGER 
  38.  
  39. number of ICMP ECHO packets to send (Default: 5)  
  40.  
  41. -L, --link  
  42.  
  43. show HTML in the plugin output (obsoleted by urlize)  
  44.  
  45. -t, --timeout=INTEGER 
  46.  
  47. Seconds before connection times out (default: 10)  
  48.  

配置nrpe.cfg后,必须重启nrpe。重启方法(杀死进程,在重启),否则更改不会生效


  1. [root@localhost ~]# ps aux|grep nrpe  
  2.  
  3. nagios 3327 0.0 0.0 4880 924 ? Ss Sep02 0:03 /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d  
  4.  
  5. root 22293 0.0 0.0 3908 648 pts/0 R+ 11:07 0:00 grep nrpe  
  6.  
  7. [root@localhost ~]# /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d  
  8.  

服务器端

测试与客户端连接,如下表示正常


  1. [root@localhost nrpe-2.8b1]# /usr/local/nagios/libexec/check_nrpe -H 10.155.2.81  
  2.  
  3. NRPE v2.8b1  
  4.  

下面表示不正常,见问题与解决(2)


  1. [root@localhost nrpe-2.8b1]# /usr/local/nagios/libexec/check_nrpe -H 10.155.2.81  
  2.  
  3. Connection refused by host  
  4.  

配置nagios.cfg,增加一条记录


  1. [root@localhost ~]# vi /usr/local/nagios/etc/nagios.cfg  
  2.  
  3. cfg_file=/usr/local/nagios/etc/objects/mylinux.cfg  
  4.  
  5. cfg_file=/usr/local/nagios/etc/objects/commands.cfg ;此前面已经设置过  
  6.  

配置nagios.cfg,增加一条记录


  1. vi /usr/local/nagios/etc/objects/commands.cfg  
  2. #在后面增加追加如下内容

    #check nrpe

    define command{

    command_name check_nrpe

    command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

    }

    mylinux

  3.  

.cfg在目录中没有,需要自己添加


  1. [root@localhost ~]# touch /usr/local/nagios/etc/objects/mylinux.cfg  
  2.  

 

 

#---------------------------------------------此段定义主机--------------------------------------------------------


  1. define host{  
  2.  
  3. use linux-server  
  4.  
  5. host_name 10.155.2.81-cacti  
  6.  
  7. alias mylinux  
  8.  
  9. address 10.155.2.81  
  10.  
  11. }  
  12.  

#--------------------------------下面定义服务器,也就是监控项------------------------------------------


  1. define service{  
  2.  
  3. use generic-service  
  4.  
  5. host_name 10.155.2.81-cacti  
  6.  
  7. service_description Swap Usage  
  8.  
  9. check_command check_nrpe!check_swap  
  10.  
  11. }  
  12.  
  13. define service{  
  14.  
  15. use generic-service  
  16.  
  17. host_name 10.155.2.81-cacti  
  18.  
  19. service_description Current Load  
  20.  
  21. check_command check_nrpe!check_load  
  22.  
  23. }  
  24.  
  25. define service{  
  26.  
  27. use generic-service  
  28.  
  29. host_name 10.155.2.81-cacti  
  30.  
  31. service_description Partition Usage  
  32.  
  33. check_command check_nrpe!check_hda1  
  34.  
  35. }  
  36.  
  37. define service{  
  38.  
  39. use generic-service  
  40.  
  41. host_name 10.155.2.81-cacti  
  42.  
  43. service_description Current Users  
  44.  
  45. check_command check_nrpe!check_users  
  46.  
  47. }  
  48.  
  49. define service{  
  50.  
  51. use generic-service  
  52.  
  53. host_name 10.155.2.81-cacti  
  54.  
  55. service_description Total Processes  
  56.  
  57. check_command check_nrpe!check_total_procs  
  58.  
  59. }  
  60.  
  61. define service{  
  62.  
  63. use generic-service  
  64.  
  65. host_name 10.155.2.81-cacti  
  66.  
  67. service_description PING  
  68.  
  69. check_command check_nrpe!check_ping81  
  70.  
  71. }  
  72.  

重启nagios,ie浏览(图3)

 

Redhat/配置/nagios

 

 

(责任编辑:IT)
------分隔线----------------------------