深入浅出Prometheus:原理、应用、源码与拓展详解
  • 推荐0
  • 收藏5
  • 浏览4.4K

深入浅出Prometheus:原理、应用、源码与拓展详解

陈晓宇 , 杨川胡 , 陈啸 (作者)  张国霞 (责任编辑)

  • 丛  书:博文视点云原生精品丛书
  • 书  号:978-7-121-36095-4
  • 出版日期:2019-04-01
  • 页  数:384
  • 开  本:
  • 出版状态:上市销售
  • 维护人:张国霞
本书主要围绕prometheus设计、架构、使用以及源码分析等多个角度全面阐述prometheus的内部原理和设计思想,本书第一部分主要围绕监控系统设计以及prometheus的核心架构,第二部分详细介绍prometheus的使用方式以及和kubernetes集成容器监控,第三部分从源代码角度深入剖析内部实现,开发示例。
Prometheus目前在开源监控系统中最为流行并加入CNCF,并且在生产环境部署案例较多,本书详细阐述prometheus的技术原理和实战,在当然市面还没有相关的图书
陈晓宇
宜信容器云架构师,负责宜信PaaS平台的设计和推广,帮助企业从传统应用迁移至云原生应用。在云计算相关行业具有丰富的研发与架构经验,并积极参与OpenStack、Kubernetes、Harbor等社区的开源项目。
杨川胡
“k8s技术圈”社区维护者,全栈工程师,具备丰富的云计算、上亿活跃用户应用后端实践经验,擅长Python、Golang、Docker、Kubernetes等技术,曾在小米担任资深研发工程师。个人GitHub页面:https://github.com/cnych。
陈啸
Prometheus二次开发深度使用者,专注于分布式搜索、流式计算、集群监控、大数据安全领域。现就职于深信服科技股份有限公司安全感知团队,负责数据平台基础架构研发工作。

目录

第1篇 Prometheus原理

第1章 监控 2
1.1 监控系统概览 2
1.2 基础资源监控 4
1.2.1 网络监控 4
1.2.2 存储监控 6
1.2.3 服务器监控 7
1.3 中间件监控 9
1.4 应用程序监控(APM) 10
1.5 日志监控 13
1.6 监控系统实现 14
1.6.1 总体架构 14
1.6.2 指标采集 15
1.6.3 数据处理 18
1.7 监控系统的发展趋势 21
1.8 本书主角——Prometheus 22
1.9 其他开源监控工具 26
1.9.1 Zabbix 26
1.9.2 Nagios 30
1.9.3 Open-Falcon 31
1.10 监控系统的对比 33
第2章 深入Prometheus设计 35
2.1 指标 35
2.1.1 Prometheus的指标定义 35
2.1.2 Prometheus的指标分类 36
2.1.3 Prometheus数据样本 40
2.2 数据采集 40
2.2.1 服务发现 42
2.2.2 数据采集 44
2.3 数据处理 45
2.3.1 重新定义标签 45
2.3.2 标签筛选 46
2.4 数据存储 46
2.4.1 本地存储 47
2.4.2 远程存储 50
2.5 数据查询 50
2.6 告警 52
2.7 集群 54
2.7.1 联邦 54
2.7.2 Thanos 55
2.8 Prometheus并非监控银弹 59
第3章 数据存储 60
3.1 存储接口 60
3.2 本地存储 62
3.2.1 历史 63
3.2.2 核心概念 63
3.2.3 相关参数 69
3.2.4 本地存储接口 70
3.3 远端存储 71
3.3.1 总体架构 71
3.3.2 远端接口规范 71
3.3.3 相关参数 74
3.4 存储汇聚 77

第2篇 Prometheus在传统应用监控中的应用
第4章 Prometheus exporter详解 80
4.1 服务分类 80
4.2 数据规范 81
4.3 exporter简介 82
4.4 基于Go客户端编写一个exporter 84
4.5 Node exporter解析 87
4.6 Redis exporter解析 90
4.6.1 Redis exporter的应用 90
4.6.2 Redis exporter的工作原理 91
4.7 MySQL server exporter解析 93
4.7.1 MySQL server exporter的应用 93
4.7.2 MySQL server exporter的工作原理 94
4.8 深入探索Go客户端 96

第3篇 Prometheus在Kubernetes监控中的应用
第5章 Kubernetes监控方案 100
5.1 Heapster 101
5.2 kube-state-metrics 104
5.3 metrics-server 105
5.4 Prometheus 105
第6章 Prometheus的安装配置 107
6.1 手动安装Prometheus 107
6.2 安装Prometheus Operator 114
6.3 在Prometheus Operator中添加自定义的监控项 125
6.4 在Prometheus Operator中添加自定义告警 132
6.4.1 配置PrometheusRule 133
6.4.2 配置告警 138
6.5 Prometheus Operator的高级配置 144
6.5.1 自动发现配置 145
6.5.2 数据持久化配置 152
第7章 Prometheus监控Kubernetes之服务配置 159
7.1 静态配置 159
7.2 服务发现配置 164
第8章 Prometheus监控Kubernetes之监控对象 171
8.1 容器监控 172
8.1.1 Prometheus的配置方式 172
8.1.2 容器指标 174
8.2 apiserver监控 177
8.2.1 配置方式 177
8.2.2 apiserver指标 181
8.3 Service监控 182
8.4 kube-state-metrics监控 185
8.5 主机监控 186
第9章 Prometheus监控Kubernetes之数据展现 191
9.1 在Kubernetes集群中安装Grafana 191
9.2 配置Grafana 200
9.2.1 数据源 200
9.2.2 Dashboard 201
9.3 插件 207
9.4 Grafana告警 212
9.4.1 邮件告警 212
9.4.2 钉钉告警 214
9.4.3 Grafana告警配置 215
第10章 Prometheus监控Kubernetes之告警 219
10.1 AlertManager简介 219
10.2 安装AlertManager 220
10.3 告警规则 225
10.4 webhook接收器 231

第4篇 Prometheus源码与拓展
第11章 Prometheus服务组件 240
11.1 Prometheus源码的目录结构 240
11.2 原生Prometheus的不足 242
11.3 源码改造——更改时区 243
11.3.1 源码修改 243
11.3.2 编译 244
11.3.3 功能验证 244
11.4 源码改造——用blog4go记录系统日志 245
11.4.1 引入blog4go库 245
11.4.2 设置日志回调函数 246
11.4.3 启动日志记录服务 246
11.4.4 配置config.xml 247
11.4.5 编译 248
11.4.6 验证服务 248
11.5 Prometheus的初始化 248
11.5.1 Prometheus性能调试 249
11.5.2 Context介绍 249
11.5.3 初始化服务组件 251
11.5.4 组件配置管理 257
11.5.5 启动服务组件 258
11.6 源码改造——MySQL规则存储 262
11.6.1 规则加载流程 262
11.6.2 表结构设计 262
11.6.3 规则加载模块 264
11.6.4 loadGroups改造 267
11.6.5 初始化 269
11.6.6 功能验证 269
11.7 数据采集 270
11.7.1 服务发现 270
11.7.2 指标采集 277
11.7.3 存储指标 289
11.8 通知管理 297
11.8.1 启动notifier服务 298
11.8.2 注册notifier 308
11.9 规则管理 311
11.9.1 规则调度 312
11.9.2 查询引擎 321
11.10 源码改造——不重复scrape及自带时间戳规则运算 327
11.10.1 实现思路 328
11.10.2 不重复scrape 328
11.10.3 自带时间戳规则运算 331
11.10.4 功能验证 343
第12章 AlertManager服务组件 348
12.1 接收告警 348
12.2 告警调度 351
12.3 告警匹配 356
12.4 告警处理 357
12.5 告警通知 362

本书勘误

印次
  • 页码:31  •  行数:3  •  印次: 1

    RDD->RRD(Round Robin Database)

    shenyangrico 提交于 2021/4/11 22:30:52
    张国霞 确认于 2021/4/26 8:47:55
  • 页码:32  •  行数:10  •  印次: 1

    Hearthbeat ->Heartbeat

    shenyangrico 提交于 2021/4/11 22:33:59
    张国霞 确认于 2021/4/26 9:57:23
  • 页码:36  •  行数:3  •  印次: 1

    “指标名称必须由字母”,写成了“字面”

    brook 提交于 2019/8/25 18:40:18
    张国霞 确认于 2019/11/26 11:31:50
  • 页码:51  •  行数:4  •  印次: 1

    图 2-13中的 TSDB 写成了 stdb

    brook 提交于 2019/8/25 18:37:26
    张国霞 确认于 2019/11/26 11:32:17
  • 页码:166  •  行数:8  •  印次: 1

    如果需要获取主机的监控信息,就需要借助node-exporter,它的暴露端口是9090,而上面Prometheus请求的端口是10250.

    上面的9090是错误的,应该是9100端口。请纠正。

    kaweit 提交于 2019/10/17 10:30:53
    张国霞 确认于 2019/11/26 11:31:08

读者评论

  • 我感觉就是垃圾书,连个代码都没有,没有你别说有啊

    august_lin发表于 2021/7/17 10:46:21
  • 下载资源里有什么?书上介绍说是可以下载资源

    abbott发表于 2021/4/7 14:45:44
    • 您好,本书不提供源码下载,目录最后一页说的是“如提供示例代码及资源文件“,如是如果的意思,不是一定有的意思。当时只是想留个空间,万一作者们要提供资源,可以让读者找到。

      张国霞发表于 2021/4/26 8:50:27
    • ”如“的说法的确容易误导读者,我们会在重印时修正。多谢!

      张国霞发表于 2021/4/26 8:51:13
  • 示例代码呢???骗访问量???

    xiaoying发表于 2021/2/16 0:46:23
  • 强烈要求要示例代码

    生如闪电发表于 2020/10/14 10:33:14
  • 说好的“示例代码文件”呢。。。囧

    wahaha2324发表于 2019/9/15 18:08:46
    • 和kubernetes结合的部分相关的资源可以在这里获取:https://github.com/cnych/kubernetes-learning

      请叫我雷锋。。。囧

      wahaha2324发表于 2019/9/15 18:14:11

同系列书

相关图书

亿级流量系统架构设计与实战

李琛轩 (作者)

本书涵盖了亿级用户应用后台通用的技术和系统架构设计思路,在内容结构上分为三大篇:架构知识篇(第1~3章),作为全书的基础知识篇,首先介绍后台的关键组件构成以及机...

 

Istio权威指南(上):云原生服务网格Istio原理与实践

张超盟 (作者)

本书是《Istio权威指南》的上册,重点讲解Istio的原理与实践,分为原理篇与实践篇。 原理篇介绍Istio的相关概念、主要架构和工作原理。其中,第1章...

 

算法笔记(第2版)

刁瑞 谢妍 (作者)

ChatGPT掀起了现象级的风暴,赶超ChatGPT潮流,算法突破是关键。 本书介绍了若干常见算法,涉及排序、哈希、动态规划与近似算法、高斯消去法、图论与线性...

 

看漫画学Python:有趣、有料、好玩、好用(全彩修订版)

关东升 赵大羽 (作者)

ython是一门既简单又强大的编程语言,被广泛应用于数据分析、大数据、网络爬虫、自动化运维、科学计算和人工智能等领域。Python也越来越重要,成为国家计算机等...

 

Linux从入门到精通

张启玉 (作者)

本书以CentOS 7.8为演示系统,以阿里云为演示服务器,从Linux常用命令入手,从一毕业就要入职公司的上手要求出发,重实战、轻原理,目的就是要带领读者从一...

 

看漫画学Python 2:有趣、有料、好玩、好用(全彩进阶版)

关东升 ,赵大羽 (作者)

本书是《看漫画学Python》的进阶版本,继续秉承有趣、有料、好玩、好用的理念,并继续采用《看漫画学Python》一书中3个不同的漫画人物角色,通过这3个角色之...