设备监控平台 设备监控软件( 五 )


大多数的组织内部通过定期人工巡检的方式观察硬件是否有故障 。而一些组织会通过服务器自带的带外管理平台,HP 的 iLo,华为的 iBMC 和戴尔的 iDrac 等平台,进行带外管理 。
当一个机房里面有多种服务器的时候,如果只是依靠这些平台,除了昂贵的 License 授权,管理成本也非常高昂 。
即使这些问题解决了,那么那些只支持 SNMP 的网络设备、存储怎么办呢?
来看看 Zabbix 是如何解决的:

  • 我们将 Zabbix 部署在带外管理网络中,这个网络会有一台 DHCP 服务器自动为所有的设备分配 IP 地址 。
  • Zabbix 在这个带外网络中会有一台 Proxy 代理服务器,通过 Zabbix 的自动发现功能,将所有的带外地址增加到 Zabbix 中;通过 IPMI 或者 SNMP 的标准协议套用监控模版,实现统一监控 。
  • 收集到的带外数据可以作为 CMDB 配置管理数据库中重要的硬件信息 。
通过 Zabbix 的带外管理大大节约了带外管理平台的授权费用,也降低了带外管理的成本,实现了统一带外管理的目标 。
以上就是 Zabbix 在落地过程中的案例和最佳实践 。
总结
如何选择监控平台
如果我们只是在 Prometheus 和 Zabbix 中选择,应该如何选择一个合适的监控平台?
我的建议是:
  • 当环境是一个纯容器的环境,毫无疑问 Prometheus 是更适合的选择,Prometheus 是天生为容器化平台打造的监控系统 。
  • 而当我们环境很复杂,有各种操作系统、硬件、中间件、数据库等,那么 Zabbix 是更适合的监控平台,Zabbix 兼顾了监控的深度和广度,实现了统一监控平台的目的 。
  • 当整个环境中又有容器、又有其他的系统,而又希望之用一套监控系统,那么 Zabbix 更合适,因为 Zabbix 的最新版本中已经强化了容器化监控的功能 。
  • 当然,有余力的话,也可以使用两台监控系统互相补足 。
使用 Zabbix 的收益
Zabbix 有简单易用的 UI,自带的 Graph 和 Screen 也可以满足企业级的展现需求 。
90% 以上的配置可以通过 Web 端统一操作和实现,这一点比强依赖于配置文件的 Prometheus 要更为方便 。
当然,如果对于 Zabbix 的原生 UI 不满意,仍然可以和 Prometheus 一样,接入 Grafana,大大降低了二次开发的成本 。
基于平台组和业务组的双维度分组,也使得 Zabbix 可以在同一组织内为不同团队提供更个性化的展现 。
Zabbix 的开源、免费等特性使得越来越多的企业,尤其是自研能力不是那么强的中小企业快速实现全栈级监控 。
Zabbix 几乎可以覆盖 80% 甚至更多的监控需求,它的高级特性也大大减少了人工介入,提升了自动化能力,并可以其他系统和平台进行持续集成 。
目前 Zabbix 的社区非常活跃,拥有丰富的学习资源,大大降低了学习成本 。
也欢迎大家积极反馈在使用 Zabbix 中碰到的问题或者改善建议给到我或者 Zabbix 社区,我们也希望通过不断的迭代和优化使其成为更加优秀的监控平台 。
作者:蔡翔华
简介:Zabbix 认证专家,国内首批 Zabbix 认证专家,DevOps Master 。活跃于 Zabbix 和 DevOps 的社区,参加《DevOps 最佳实践》和《Zabbix 官方手册》的翻译工作;10 年四大及银行 IT 基础架构经验,7 年 Zabbix 和 DevOps 经验 。
设备监控软件)

推荐阅读