跳转至

Zabbix集成

Zabbix 是由Alexei Vladishev 开发的一种网络监视、管理系统,基于 Server-Client 架构。可用于监视各种网络服务、服务器和网络机器等状态。 Zabbix 使用 MySQL、PostgreSQL、SQLite、Oracle 或 IBM DB2 储存资料。


zabbix集成CA步骤

  1. 创建应用

    在CA界面创建zabbix应用,并获取 appkey

  2. 在zabbix server端安装CA探针

    1. 切换到zabbix脚本目录:

      cd /usr/local/zabbix-server/share/zabbix/alertscripts
      
      <small>补充:查看zabbix脚本目录方法:
      vi /etc/zabbix/zabbix_server.conf
      查看AlertScriptsPath</small>
      
    2. 获取Cloud Alert agent包:

      wget https://download.aiops.com/ca_agent/zabbix/ca_zabbix_release-2.1.0.tar.gz
      
    3. 解压、安装。

      tar -xzf ca_zabbix_release-2.1.0.tar.gz cd cloudalert/bin bash install.sh -- --处填入您新建应用时生成的appkey

      安装说明

      1. 在安装过程中根据安装提示,输入zabbix管理/监控/web登陆地址、管理员用户名、密码。
      2. zabbix管理地址正确示例:http://zabbix.server.com/zabbix
    4. 当提示"安装成功"时表示安装成功!

      产生新的zabbix告警(problem),动作状态为“已送达”表示集成成功。

      安装说明

      集成成功后不需要启动服务,可直接使用。


CA探针安装报错说明

1. Zabbix 管理地址输入错误

错误提示:

The Zabbix management address you entered is incorrect!!!Check please...

解决办法:正确输入Zabbix管理地址(正确示例:http://主机域名:端口/zabbix)

2. zabbix用户名、密码错误

错误提示:

Auth Failed,Please check the user and password!!!`

解决办法:正确输入Zabbix管理员账号、密码,确认可用通过该账户正确登录zabbix

3. 媒体类型(Media Type)已经存在

错误提示:

create media type failed! error message:{"jsonrpc":"2.0","error":{"code":-32602,"message":"Invalid params.","data":"Media type \"cloudalert media\" already exists."},"id":1}

解决办法:登陆Zabbix管理控制台,删除媒体类型“cloudalert media”

4. 用户组(User Group)已经存在

错误提示:

create user group failed! error message:{"jsonrpc":"2.0","error":{"code":-32602,"message":"Invalid params.","data":"User group \"cloudalert group\" already exists."},"id":1}

解决办法:登陆Zabbix管理控制台,删除用户组“cloudalert group”

5. 用户(User)已经存在

错误提示:

create user failed! error message:{"jsonrpc":"2.0","error":{"code":-32602,"message":"Invalid params.","data":"User \"cloudalert\" already exists."},"id":1}

解决办法:登陆Zabbix管理控制台,删除用户“cloudalert”

6. 动作(Action)已经存在

错误提示:

create action failed! error message:{"jsonrpc":"2.0","error":{"code":-32602,"message":"Invalid params.","data":"Action \"cloudalert action\" already exists."},"id":1}

解决办法:登陆Zabbix管理控制台,删除动作“cloudalert action”


CA探针安装后测试告警方法

测试原理: 在zabbix管理平台中手动关闭掉已产生的告警,使zabbix重新产生告警,从而触发动作(action)并将告警发送到Cloud Alert。

  1. 登录zabbix进入问题列表:监测中(Monitoring)->问题(Problems)。

  2. 选中告警->【整批确认】(Bulk acknowledge)

  3. 勾选【关闭问题】(Close problem)->【确认】(Acknowledge)

    提示

    当【关闭问题】无法勾选时,需要修改触发器-允许手动关闭

  4. 当zabbix重新生成告警时,查看动作是否触发成功。状态是“已送到”表示集成成功

  5. 登录Cloud Alert,查看告警。


集成后收不到告警排错方法

排查步骤:

  1. 进入zabbix管控台,监测中 -> 问题 勾选任意告警然后选择下方的 整批确认 按钮,触发zabbix确认告警(problem),动作状态为 已送达

    如动作状态为 已失败,提示信息如下:

    解决方案:alert.sh 脚本放到 /usr/local/zabbix/alertscripts/cloudalert/bin 即可。

  2. 查看探针日志

    进入zabbix探针日志目录 (/usr/local/zabbix-server/share/zabbix/alertscripts/cloudalert/logs),查看探针日志(命令 :tail -f cloudalert.log

  3. 确认探针日志

    有两种异常情况:

    告警参数

    [ZabbixActionParams] zabbix 告警参数是不是正常
    

    正常示例:

    2018-02-02 13:02:34 INFO [ZabbixActionParams]: {'app':'bb23435e-0669-92de-c864-e75023476970','eventId':'ci3-13608','eventType':'trigger','alarmName':'Com_selectentityName:ci3','entityId':'ci3-13608','alarmContent':'ci3 MySQL select operations per second:493.85 qps','priority':'5','host':'ci3','tag':[{'hostgroups':['Test']}],'agentVersion':'1120','service':'MySQL select operations per second','ip':'10.251.23.168','itemName':'MySQL select operations per second','itemValue':'493.85 qps'}

    告警转发状态为failed

    [ItsmAlertResponse] 告警转发状态是不是成功(result 为success为成功,failed表示失败)
    

    正常示例:

    2018-02-02 13:02:35 INFO [ItsmAlertResponse]: {"result":"success","message":"receive event success","data":0,"totalCount": 0,"code":"0"}

如果告警转发状态为success,表示zabbix探针集成成功,可以登录Cloud Alert查看告警,设置分派通知策略。

补充

(1)告警转发状态为failed,请联系CA客服人员

(2)告警转发状态为success,任然接受不到告警请联系CA客服人员


zabbix与CA告警级别映射关系

zabbix 级别状态 参数值 Cloud Alert 级别状态
information 1 提醒
not_classified 1 提醒
warning 2 警告
average 2 警告
high 3 严重
disaster 3 严重