由于我公司服务器都是使用dell(我公司是手游方面,服务器全部是dell),服务器型号有r410、r420、r710、r720,系统有centos 5.x、centos 6.x 、redhat 5.x、redhat 6.x、ubuntu 12.04、ubuntu 12.04.4等版本,对于硬件监控,我测试过ipmi、megacli、smart等,但这些监控软件的监控内容都比较少,没有通用的那种,最后找到了dell专门的omsa,满足了我的需求,下面就介绍一下使用omsa来监控dell服务器的硬件信息。 目前我监控以下的硬件信息: 1、cpu处理器状态 2、cpu省电模式状态(如果开启了省电模式,在压力大的时候,会很卡的) 3、raid状态(比如做了哪个raid模式,raid状态是否正常) 4、内存状态(可以查看当前服务器最大支持多少内存,当前多少内存,如果内存有问题,可以显示哪个位置内存故障) 5、机器温度状态(监控机器的温度是否超过阀值) 6、物理硬盘状态(监控物理硬盘是否有故障) 7、电源状态(是单电还是双电,是否有故障) 8、系统面板CMOS电池(cmos电池是否有故障) 9、网卡状态(当前的网卡数量,以及网卡是否有问题) 10、风扇(当前的风扇数量,以及是否有故障) 默认是cpu省电模式监控关闭报警,其他的监控都是15分钟监控一次,如果连续2次都有问题则报警通知。 下面是监控图 1、硬件正常的服务器监控截图
2、部分硬件不正常的监控图 可以看到此服务器的cpu开启了省电模式,并且内存条有问题 经过命令行查看,发现有问题的内存条是第一个插槽
下面是安装方法: 一、客户端 A.在redhat或者centos系统里安装 1、安装dell的yum源
2、安装omsa
3、做软连接
4、关闭web模式(仅允许运行cli)
5、启动omsa
6、把omsa加入到开机启动里
以上是在centos或者redhat系统里安装omsa。 B.下面是在ubuntu下的安装 1、增加源
2、检测与增加key
3、更新源
4、安装omsa
5、做软连接
6、启动cli模式omsa
C.zabbix客户端的配置 1、下面是在zabbix_agentd.conf里配置
2、重启zabbix_agentd服务
如果需要在其他系统里安装,请参看官方wiki,地址是http://linux.dell.com/wiki/index.php/Repository/hardware。 二、服务端 1、模板导入 把Template Hardware Monitor导入到zabbix里(模板在附件),具体操作不介绍。 2、主机关联模板
把需要监控的硬件服务器关联此模板即可 本文出自 “吟—技术交流” 博客,请务必保留此出处http://dl528888.blog.51cto.com/2382721/1403893 (责任编辑:IT) |