Zabbix监控系统深度实践(第2版)
  • 推荐0
  • 收藏6
  • 浏览1.3K

Zabbix监控系统深度实践(第2版)

姚仁捷 (作者) 

  • 书  号:978-7-121-29608-6
  • 出版日期:2016-08-19
  • 页  数:376
  • 开  本:16(185*235)
  • 出版状态:上市销售
  • 维护人:董英
这是一本由浅入深,全面讲解Zabbix应用与原理的技术书籍,也是作者多年实战经验的总结和浓缩。在概念篇,从一个简单但完整的入门案例讲起,案例中有最基本的概念介绍,通过案例帮助那些只要将服务器加入监控,并且看到监控数据的读者;然后逐步深入,在进阶篇介绍Zabbix的各方各面的配置;在设计篇中对Zabbix的内部原理进行深入剖析,包括Zabbix与数据库的交互Zabbix数据库表的设计等,并分享作者在Zabbix上踩过的坑以及解决问题的思路。最后会在开源部分介绍58同城开源的Zatree和Chrome的插件、手机客户端等工具。
这本书会从我们工作中的实际需求出发,以实际案例作为指引,希望对于读者而言,不仅仅是学会某些具体的操作,而是深入了解Zabbix 的设计思路,掌握解决问题的方法。
序一

姚仁捷同学跟我提起,他要写一本关于Zabbix 的书,其实一开始我是不太鼓励的。在我看来,
写书向大众传播知识,是一件很严肃的事情,仁捷作为一名年轻的技术人员,去完成一本书可
能还是会有些吃力的。但是我看到他有这个决心,对待书的态度也非常虔诚,每天都会在繁忙
的工作之余加班写作,书真的写完了,不由得很是佩服,作为他毕业到现在的多年老板,必须
顶一下。事实上,从PPTV 到唯品会,仁捷都基本上是独立承担一个领域的工作,借鉴业界的
最佳实践(Best Practice),从无到有地快速建立起完整的解决方案。的确是,聪明的人,给机会,就能脱颖而出。
Zabbix 是业界近年来较为流行的一个比较完善的开源系统监控解决方案,我们当初也是调
研了不少解决方案才选择了它。姚仁捷曾经是PPTV 的Zabbix 集群的负责人。PPTV 的Zabbix
应用,已经是国内较大规模的系统监控了,覆盖了当时5000 多台主机和上面应用的几十万个
监控点,近百万的监控点记录,也修改了Zabbix 多处源码,实现了很多自动化的监控部署和
Proxy-Master 的分布式监控,以及通过Zabbix Trigger 自动分析等,也就Zabbix 本身的一些缺点
设计了对应的workaround 的办法和二次开发,可以说是国内较为领先的大规模部署解决实际案
例。在Zabbix 的实践领域,PPTV 的很多方法、思想和技巧都很有价值,仁捷同学在这本书中
也都有涉及。
好的经验还是值得分享的,就算还不是完美的。
希望这本书能够给大家带来一手的Zabbix 实战经验,更加希望大家可以从中借鉴作者分
享的经验,少走弯路,帮助公司更加多快好省地建设系统监控解决方案。
唯品会高级总监
诸超

序 二

Zabbix 作为一款企业级的、开源的、分布式的监控套件,设计理念超前,解决了以往监控
软件的短板,可以说是现在最流行的监控解决方案之一。
Zabbix 可以监控网络和服务的健康状况,可以利用模板批量添加服务器,可以自定义监控
项,可以利用灵活的报警机制给运维人员发送E-mail 和短信报警,从而保证了运维人员能快
速对问题作出响应。此外,Zabbix 简单易上手,只要稍作学习,就能迅速搭建一套运维监控平
台,瞬间高大上。
Zabbix 在分布式方面做了大量的优化工作,这样可以保证在多机房和对海量服务器进行监
控时,能快速高效地收集数据,并集中在一个界面内展示。不过目前我所负责项目中,15 万
个Items 和1000 多个Hosts 用了一个配置比较高的服务器在抗,毫无压力,等服务器规模再大
一些,机房比较多的时候,我会考虑用分布式。
我使用Zabbix 也快1 年了,替换了原来的Nagios+Cacti 方案。Zabbix 兼有Nagios+Cacti
的特点,所以现在维护一个系统就可以了,极大地方便了运维工作。因为公司大部分都是标准
化的服务和服务器,迁移过程也比较顺利,只要事先做好分组,设置几个模板一关联就可以了,
迁移的大部分时间花在了寻找合理阈值和设置靠谱Trigger 上,这个可能需要慢慢积累经验。
作为Zabbix 插件Zatree 的开发者之一,我一直比较关注Zabbix 在国内的发展,这几年是
Zabbix 发展的快速时期,大量爱好者在QQ 群、微博和社区参与讨论和分享,极大地丰富了
Zabbix 的中文资料。作为曾经国内最大规模Zabbix 集群的负责人,姚仁捷在本书中全面讲解了
Zabbix 的安装、配置、使用及技巧,提供了大量的案例和解决问题的心得,其中也介绍了Zatee
插件的安装和使用,希望大家可以一边看书,一边亲自动手实践,这样效果会更好。
相信人人都能成为监控专家、运维专家。
中国最大开源社区Chinaunix 创始人之一
窦喆
@ 南非蜘蛛


前言

本书的由来
我从职业生涯开始至今,就一直在和监控系统打交道。
我最早在eBay 容量规划小组工作,使用监控系统查看服务器状态及网站运营指标;后来
到PPTV 运维部,通过监控系统的数据了解上线发布的结果和网站的健康程度等情况;现在到
了唯品会,我们的监控系统能够从业务、技术两个维度考察当前公司网站的运作情况。
在有监控系统之前,工程师需要到服务器上去敲命令来获取系统数据;为了分析问题,可
能还需要将数据复制到本地计算机的Excel 里进行画图;最要命的是,在出现问题的时候无法
知道,只有在用户报障后才能察觉。这是多么骇人听闻的场景!
而当我们有了一个好的监控系统后,这些问题就迎刃而解了。我们可以在一个界面中浏览
整个机房的服务器状态、可以在Web 前端方便地查看监控数据、可以回溯寻找事故发生时系
统的问题和报警情况。现在,我们的工程师们已经可以一边悠闲地喝着咖啡一边分析问题了。
监控系统是整个运维自动化体系中非常重要的环节。从服务器上架到最后被回收重用,都
有监控系统的身影。服务器上架时,它需要添加监控;在服务器工作过程中,监控系统要时刻
注意服务器的健康,并且在服务器出现异常时,要发出报警通知对应的人员;在服务器被回收
时,监控系统要取消服务器的监控。这些都需要监控系统拥有API,能够方便地跟外部其他系
统一起工作,把自己的工作自动化起来。
国内的互联网巨头们,可以自行开发一套监控系统。而对于绝大多数企业来说,开源的
Zabbix 是非常棒的选择。它能够非常好地实现以上这些需求。可以说,目前Zabbix 是最热门
的开源监控系统。
本书的内容结构
从周围的QQ 群、论坛等地方,我发现大家对于Zabbix 的学习都是非常零散的,缺少一个
系统的学习过程和解决问题的正确思路。在这本书的前面,我会先向大家介绍一个最简单的入
门案例,案例中有最基本的概念介绍,通过案例帮助那些只需将服务器加入监控,并且看到监
控数据的读者。后面深入一些,会介绍Zabbix 的方方面面的配置,适合打算使用Zabbix 高级
功能的读者。在接下来的部分,会深入剖析Zabbix 的内部原理,包括Zabbix 与数据库的交互、
Zabbix 数据库表的设计等我在Zabbix 上踩过的坑以及解决问题的思路。希望能授之以渔。在本
书的最后部分,主要介绍Zabbix 在开源方面的进展,最主要的就是58 同城开源的Zatree,以
及Chrome 的插件和手机客户端。
本书会从我们工作中的实际需求出发,介绍Zabbix 的使用方法和其配置管理。在这些内
容之后,会有深入一些的对于Zabbix 实现的讲解,希望对于读者而言,不仅仅是学会某些具
体的操作,而是深入了解Zabbix 的设计思路,掌握解决问题的方法。
作者联系方式
由于经验的不足,书中可能会有一些不足之处,大家可以通过微博@ 超大杯摩卡星冰乐,
或者邮箱baniu.yao@gmail.com,与我联系。
声明
在刚开始进行写作时,我考虑到很多读者是用中文版的Zabbix,所以文中的Zabbix 的术
语都使用中文。但后来我觉得对于Zabbix 的术语,研究人员是需要了解它的英文说法的,这
样在同行之间才能更好地交流,也可以在Google 上更好地检索信息。基于这个原因,我将之
前的中文术语全部又换成了英文。由于这些术语非常多,虽然编辑帮我细致地进行了检查,难
免有疏漏,希望大家能够谅解。
致谢
在前言的最后,要感谢很多人。首先感谢的是我的父母,没有你们,就没有我。然后要感
谢我的老婆,因为要忙于写书,很多时候不能陪你。最后要感谢的是诸超、陈文春、吴晓刚、
周昕毅、朱宁和刘海阳等同事的帮助,在我写书的过程中,给出了很多宝贵的建议。谢谢各位。

目录

目录 阅读
第1部分 概念篇
第1章 自动化运维和监控系统
第2章 Zabbix简介
第3章 Zabbix安装
第4章 监控第一台Host
第2部分 配置篇
第5章 增加监控
第6章 报警配置
第7章 数据可视化
第8章 Users和Macros
第9章 IT services服务监控与Web monitoring网络监控
第10章 Zabbix前端界面
第11章 Discovery
第3部分 进阶篇
第12章 Zabbix API
第13章 Zabbix分布式监控
第14章 Zabbix系统优化
第15章 轻量级日志监控应用
第4部分 设计篇
第16章 Zabbix数据库表结构解析
第17章 History和Trends
第18章 Zabbix和数据库交互详解
第19章 Zabbix 2.2新功能介绍
第20章 Zabbix内置监控项实现
第5部分 社区和开源
第21章 典型案例分析
第22章 Zabbix代码问题和解决
第23章 PPTV的Zabbix监控体系
第24章 Zatree
第25章 Zabbix第三方插件
第26章 微信公众平台报警
第27章 社区论坛

读者评论

  • 这书过时了,如今的zabbix变化大,买了一本无用的书

    wenlong2022发表于 2018/7/13 20:51:43
  • 这本书的配置文件和一些脚本的源码为什么没提供下载?

    wenlong2022发表于 2018/7/10 20:21:32

电子书版本

  • Epub
  • Mobi

相关图书

Terraform:多云、混合云环境下实现基础设施即代码(第2版)

Yevgeniy Brikman ( (作者) 白宇 (译者)

Terraform工具已经成为DevOps领域的关键角色。在各种云平台和虚拟化环境(如AWS、Goolge Cloud、Azure等)中,可以对基础设施即代码(...

¥108.00

DevOps安全:云安全服务

Julien Vehent (作者) 覃宇 (译者)

本书主要介绍了 DevOps 实践中最容易被忽视的一环——安全,并且对云原生服务的安全保障也做了全面的阐述。书中详细介绍了 Web 攻击防范、权限验证、日志监控...

¥108.00

企业级DevOps技术与工具实战

刘淼 张笑梅 (作者)

本书包含DevOps理论的介绍,深入浅出地解析了DevOps体系所包括的Agile/Lean/ITSM/TPS各种方法的精粹和脉络,为DevOps爱好者提供了较...

 

SRE生存指南:系统中断响应与正常运行时间最大化

Nat Welch (作者) 冯文辉 冯文辉 (译者)

站点可靠性工程(Site Reliability Engineering,简称SRE)是一个令人兴奋的新兴领域,它专注于如何确保系统稳定、可靠地运行。本书基于一...

 

Zabbix企业级分布式监控系统(第2版)

吴兆松 (作者)

本书基于稳定版本Zabbix 4.0,对Zabbix的各项功能进行了详细而深入的讲解,包括监控系统规划、安装包定制、架构高可用、性能调优、指标数据采集、自动化处...

 

Nginx实战:基于Lua语言的配置、开发与架构详解

王力 王力 (作者)

本书主要讲解了Nginx在反向代理和应用开发中的作用,阅读本书可以了解Nginx在互联网开发中扮演的多个角色,充分利用这些角色的各项功能有助于提升服务的整体性能...

¥47.40