封面
版权信息
作者简介
内容简介
专家力荐
序
前言
开端篇 弱化边界感
第1章 引言
1.1 运维架构和SRE
1.2 理解业务,技术为业务服务
1.3 不设边界
1.4 SRE金字塔
1.5 总结
第2章 重视测试环境和预发布环境
2.1 提效和维稳的第一道门槛——测试环境
2.1.1 低级错误
2.1.2 提效分析
2.2 “守门员”——预发布环境
2.2.1 低级错误
- APP免费
2.2.2 提效分析
- APP免费
2.3 两大环境问题根本原因溯源
- APP免费
2.4 微拍堂测试环境治理思路介绍
- APP免费
2.5 总结
- APP免费
监控篇 底层逻辑的艺术
- APP免费
第3章 浅谈监控系统设计
- APP免费
3.1 梳理监控体系
- APP免费
3.2 梳理监控指标
- APP免费
3.3 变更监控
- APP免费
3.4 准实时系统监控
- APP免费
3.5 短时进程追踪工具
- APP免费
3.6 全链路监控
- APP免费
3.7 商业监控平台的选用建议
- APP免费
3.8 监控方式:白盒监控与黑盒监控
- APP免费
3.9 从监控数据中总结规律
- APP免费
3.10 黄金指标
- APP免费
3.11 总结
- APP免费
第4章 云原生可观测性开源工具——Kindling
- APP免费
4.1 行业现状
- APP免费
4.2 Kindling解决方案——关联内核可观测性数据的Trace
- APP免费
4.3 Kindling探针的架构设计理念
- APP免费
4.4 Kindling探针架构
- APP免费
4.4.1 内核态程序:drivers
- APP免费
4.4.2 用户态C/C++程序:kindling-probe
- APP免费
4.4.3 用户态Go程序:kindling-collector
- APP免费
4.4.4 程序间通信方式
- APP免费
4.5 在线Demo介绍
- APP免费
4.6 案例分享
- APP免费
4.6.1 安装
- APP免费
4.6.2 功能介绍
- APP免费
4.6.3 稳定性价值
- APP免费
4.7 总结
- APP免费
第5章 高阶实战——打造可持续维护的闭环流程
- APP免费
5.1 案例:动态观测SQL质量流程设计
- APP免费
5.1.1 分析规范难以落地的原因
- APP免费
5.1.2 监督与管控流程设计
- APP免费
5.1.3 通知和统计
- APP免费
5.2 案例:WebP格式图片的规范和落地实践
- APP免费
5.2.1 规范无法持续推广
- APP免费
5.2.2 成本和用户体验上的双赢
- APP免费
5.2.3 计划实施
- APP免费
5.2.4 管控机制
- APP免费
5.2.5 采集数据信息和数据加工处理
- APP免费
5.2.6 巡检平台之规范化监督
- APP免费
5.3 案例:管道通信规范化实践
- APP免费
5.3.1 我们每天都在使用管道
- APP免费
5.3.2 管道示例场景及性能说明
- APP免费
5.3.3 如何规范管道使用场景
- APP免费
5.4 标准和规范治理平台
- APP免费
5.4.1 现状
- APP免费
5.4.2 设计思路
- APP免费
5.5 总结
- APP免费
第6章 挖掘Nginx的监控价值
- APP免费
6.1 URI指纹服务设计
- APP免费
6.2 Nginx日志分析指南
- APP免费
6.2.1 参数白名单
- APP免费
6.2.2 URI的响应时间和HTTP状态监控
- APP免费
6.2.3 URI响应字节数波动分析
- APP免费
6.2.4 查询URL请求的项目
- APP免费
6.2.5 注意HTTPS的透传
- APP免费
6.2.6 利用Nginx完成动态全链路比例调整
- APP免费
6.3 总结
- APP免费
故障篇 故障的生命周期
- APP免费
第7章 事前治理的方法论
- APP免费
7.1 从故障中总结经验
- APP免费
7.2 从系统资源层面和日志中巡检异常
- APP免费
7.3 从标准和规范中寻找闭环之路
- APP免费
7.4 从业务中挖掘基础服务的使用问题
- APP免费
7.5 技术风险防控运营成本
- APP免费
7.6 总结
- APP免费
第8章 变更管控设计思路
- APP免费
8.1 变更管控
- APP免费
8.1.1 变更对象
- APP免费
8.1.2 变更发布
- APP免费
8.1.3 变更可灰度
- APP免费
8.1.4 变更可回滚
- APP免费
8.1.5 变更可监控
- APP免费
8.1.6 配置项变更
- APP免费
8.1.7 变更管控思路
- APP免费
8.2 JumpServer使用的艺术及工单交互
- APP免费
8.3 变更三板斧:运维团队的可监控、可灰度、可回滚实践
- APP免费
8.3.1 案例:云服务器资源伸缩稳定性
- APP免费
8.3.2 案例:CDN OpenResty的变更策略
- APP免费
8.4 总结
- APP免费
第9章 轮值的设计思路
- APP免费
9.1 值班模式探究
- APP免费
9.1.1 让开发人员参与其中
- APP免费
9.1.2 制定KPI
- APP免费
9.1.3 值班人员的边界探讨
- APP免费
9.2 值班机器人
- APP免费
9.3 提升值班价值——SRE需求池设计
- APP免费
9.3.1 结合日常巡检与非值班时间
- APP免费
9.3.2 在烦琐的工作中收集需求
- APP免费
9.4 总结
- APP免费
第10章 故障演练与应急预案
- APP免费
10.1 故障演练缘由
- APP免费
10.1.1 更好地面对系统规模增长带来的复杂性
- APP免费
10.1.2 提升故障的排查速度
- APP免费
10.1.3 验证应急预案的正确性
- APP免费
10.1.4 验证基础设施的稳定性
- APP免费
10.1.5 验证监控感知能力
- APP免费
10.1.6 验证应急流程的顺畅度
- APP免费
10.2 故障演练流程
- APP免费
10.2.1 故障演练场景关键要素
- APP免费
10.2.2 故障演练预期
- APP免费
10.3 应急预案
- APP免费
10.3.1 应急场景标准化
- APP免费
10.3.2 梳理应急预案清单
- APP免费
10.4 总结
- APP免费
第11章 应急响应流程实践
- APP免费
11.1 收拢故障上报来源
- APP免费
11.1.1 从技术体系内部发现
- APP免费
11.1.2 从技术体系外部发现
- APP免费
11.2 建立应急小组
- APP免费
11.2.1 人多力量弱
- APP免费
11.2.2 稳定性接口人和岗位权限
- APP免费
11.2.3 完善客诉标准化术语
- APP免费
11.3 故障噪点治理
- APP免费
11.3.1 报警治理
- APP免费
11.3.2 设计外部反馈阈值
- APP免费
11.3.3 收集第三方抖动事件
- APP免费
11.4 控制应急节奏
- APP免费
11.4.1 舍小保大
- APP免费
11.4.2 “优先止血”,后续定位根本原因
- APP免费
11.4.3 及时同步信息,减少信息差
- APP免费
11.5 应急“止血”的常见操作
- APP免费
11.5.1 代码回滚
- APP免费
11.5.2 重启
- APP免费
11.5.3 时序监控下的限流、熔断、扩容
- APP免费
11.5.4 业务降级
- APP免费
11.5.5 阻断慢查询
- APP免费
11.5.6 网络与运营商
- APP免费
11.5.7 重识监控
- APP免费
11.6 总结
- APP免费
第12章 静态容灾降级系统
- APP免费
12.1 荆棘之路
- APP免费
12.2 设计之路
- APP免费
12.3 架构流程图
- APP免费
12.3.1 反向代理系统
- APP免费
12.3.2 日志分析系统
- APP免费
12.3.3 后台系统——利用URI指纹服务
- APP免费
12.3.4 爬虫系统
- APP免费
12.3.5 容灾的缓存系统
- APP免费
12.3.6 基于时间的版本用途
- APP免费
12.3.7 异地容灾
- APP免费
12.4 核心代码解说
- APP免费
12.4.1 Ngx_Lua应用
- APP免费
12.4.2 爬虫和日志分析系统的关系
- APP免费
12.4.3 完全容灾和部分容灾功能
- APP免费
12.5 静态容灾的智能关闭方案
- APP免费
12.5.1 从日志分析系统复制请求
- APP免费
12.5.2 利用GoReplay复制流量
- APP免费
12.5.3 利用Nginx的mirror镜像功能
- APP免费
12.5.4 灰度验证容灾系统缓存——闭环设计
- APP免费
12.6 替换爬虫的新思路
- APP免费
12.7 总结
- APP免费
第13章 基于OpenResty的动态限流设计思路
- APP免费
13.1 常见反向代理限流方案缺点分析
- APP免费
13.2 动态限流设计思路
- APP免费
13.3 多维度限流
- APP免费
13.4 智能感知响应能力动态控速设计方案
- APP免费
13.5 屏蔽慢请求带来的服务阻塞
- APP免费
13.6 总结
- APP免费
第14章 故障复盘
- APP免费
14.1 复盘前
- APP免费
14.2 复盘中
- APP免费
14.3 复盘后
- APP免费
14.4 自省
- APP免费
14.5 跨部门分享
- APP免费
14.6 故障库
- APP免费
14.7 总结
- APP免费
容量篇 性能与成本间的平衡
- APP免费
第15章 成本优化
- APP免费
15.1 成本优化事前准备
- APP免费
15.1.1 目标的制定和价值体现
- APP免费
15.1.2 IT成本与人力成本的权衡
- APP免费
15.1.3 提升对系统的理解
- APP免费
15.1.4 评估优化前后的数据统计及业务影响
- APP免费
15.1.5 从用户体验看待成本优化
- APP免费
15.1.6 梳理业务和资源的关系
- APP免费
15.2 公有云基础资源优化实践
- APP免费
15.2.1 成本管理白皮书
- APP免费
15.2.2 合理化资源使用率
- APP免费
15.2.3 自建产品和云产品的使用场景优化
- APP免费
15.2.4 基于业务场景的成本控制
- APP免费
15.3 总结
- APP免费
第16章 智能伸缩平台
- APP免费
16.1 弹性伸缩平台关键路径盘点
- APP免费
16.2 基础设施建设
- APP免费
16.2.1 基于Pod的HPA传统模式
- APP免费
16.2.2 基于Cluster-Autoscaler的Node伸缩
- APP免费
16.3 基于业务场景的实战
- APP免费
16.3.1 定时伸缩
- APP免费
16.3.2 基于预测的弹性伸缩
- APP免费
16.4 风险控制体系
- APP免费
16.4.1 动态限流触发规则
- APP免费
16.4.2 扩容节点失败和业务降级
- APP免费
16.5 总结
- APP免费
第17章 容量规划
- APP免费
17.1 容量规划现状
- APP免费
17.2 容量规划建设思路
- APP免费
17.2.1 建设核心
- APP免费
17.2.2 建设思路
- APP免费
17.3 应用系统容量规划说明
- APP免费
17.4 基于巡检模式的容量评估流程
- APP免费
17.4.1 对流量来源的梳理
- APP免费
17.4.2 对容量对象的梳理
- APP免费
17.4.3 收集日常关键性数据
- APP免费
17.5 对容量规划关注点的梳理
- APP免费
17.5.1 压力测试
- APP免费
17.5.2 业务放量
- APP免费
17.5.3 大促活动
- APP免费
17.5.4 秒杀业务
- APP免费
17.5.5 关注运营活动计划
- APP免费
17.5.6 尖刺限流
- APP免费
17.6 总结
- APP免费
第18章 编程能力
- APP免费
18.1 养成写伪代码的习惯
- APP免费
18.2 养成管理代码的习惯
- APP免费
18.3 编程能力分级
- APP免费
18.4 编程能力更深层的价值探讨
- APP免费
18.4.1 如何看待PHP短连接问题
- APP免费
18.4.2 理解Redis和Memcached在业务场景上的区别
- APP免费
18.4.3 进程、线程、协程在Linux系统中的表现
- APP免费
18.4.4 探究阻塞和非阻塞、异步和同步在系统中的表现
- APP免费
18.4.5 共享内存
- APP免费
18.4.6 尝试一些导致进程崩溃的操作
- APP免费
18.4.7 学习秒杀系统的业务架构
- APP免费
18.4.8 给自己的代码做闭环实践
- APP免费
18.4.9 参与业务开发日常
- APP免费
18.5 熟悉编程语言特性
- APP免费
18.6 通过系统分析倒推应用配置问题
- APP免费
18.6.1 通过access函数发现PHP性能问题
- APP免费
18.6.2 Java连接池失效
- APP免费
18.7 总结
- APP免费
全局视角篇 运维破圈
- APP免费
第19章 开启测试视角
- APP免费
19.1 测试人员的职责边界
- APP免费
19.2 压力测试
- APP免费
19.2.1 压测黑名单思维
- APP免费
19.2.2 压测利器Wrk
- APP免费
19.2.3 流量镜像工具GoReplay
- APP免费
19.3 自动化测试监控平台设计
- APP免费
19.3.1 “牵一发而动全身”的迭代
- APP免费
19.3.2 OpenDiffy介绍
- APP免费
19.3.3 变更管控的支撑系统OpenDiffy+GoReplay
- APP免费
19.4 破坏性测试探究
- APP免费
19.5 从前端的体验“找碴儿”
- APP免费
19.5.1 基于浏览器特性的服务优化
- APP免费
19.5.2 从图片加载中寻找优化方法
- APP免费
19.5.3 数据埋点的发送频率
- APP免费
19.5.4 域名的使用限制
- APP免费
19.5.5 请求重复性
- APP免费
19.5.6 PageSpeed Insights分析页面的加载
- APP免费
19.5.7 定期的内耗分析
- APP免费
19.6 总结
- APP免费
第20章 开启用户视角
- APP免费
20.1 内外兼顾
- APP免费
20.1.1 内部用户
- APP免费
20.1.2 外部用户
- APP免费
20.2 建立反馈机制
- APP免费
20.2.1 优化客服反馈机制
- APP免费
20.2.2 与客服合作的案例分享
- APP免费
20.2.3 奖励机制
- APP免费
20.2.4 关注舆情
- APP免费
20.3 产品体验——谷歌SRE的高阶思维
- APP免费
20.3.1 不仅仅是体验
- APP免费
20.3.2 交互烦琐
- APP免费
20.3.3 无人问津
- APP免费
20.3.4 ROI
- APP免费
20.4 防御体系的“误伤”指南
- APP免费
20.4.1 WAF“误伤”
- APP免费
20.4.2 内部风控“误伤”
- APP免费
20.5 关注客户端环境
- APP免费
20.5.1 客户端机型配置
- APP免费
20.5.2 网络
- APP免费
20.6 总结
- APP免费
第21章 开启前端和App开发人员视角
- APP免费
21.1 概述
- APP免费
21.2 为什么要解决性能问题
- APP免费
21.3 缓存
- APP免费
21.3.1 强缓存
- APP免费
21.3.2 协商缓存
- APP免费
21.4 网络请求
- APP免费
21.4.1 HTTP/2.0
- APP免费
21.4.2 DNS预解析
- APP免费
21.4.3 预先建立连接
- APP免费
21.4.4 服务器应该避免过多重定向
- APP免费
21.5 客户端计算
- APP免费
21.6 预加载
- APP免费
21.7 梳理技术风险
- APP免费
21.7.1 请求阻塞式串行加载
- APP免费
21.7.2 埋点发送过于频繁
- APP免费
21.7.3 弱网下的资源加载降级
- APP免费
21.7.4 拨测
- APP免费
21.8 总结
- APP免费
第22章 DNS应用场景实践
- APP免费
22.1 利用DNS完成故障转移
- APP免费
22.2 使用HTTPDNS提升访问稳定性
- APP免费
22.3 提升测试、A/B测试等环境的切换效率
- APP免费
22.4 域名反向解析用途实践
- APP免费
22.5 内部DNS系统高可用实践
- APP免费
22.5.1 两次DNS故障
- APP免费
22.5.2 问题和思考
- APP免费
22.5.3 改进措施
- APP免费
22.5.4 配置及验证
- APP免费
22.5.5 监控
- APP免费
22.6 总结
- APP免费
性能篇 SRE进阶之路
- APP免费
第23章 高并发网关价值探究
- APP免费
23.1 通用功能介绍
- APP免费
23.2 网关中的聚合模式
- APP免费
23.2.1 Lura启示录
- APP免费
23.2.2 APISIX中的batch-requests插件
- APP免费
23.2.3 从GraphQL发现的技术实践思路
- APP免费
23.3 兼顾缓存的网关设计思路
- APP免费
23.3.1 APISIX的proxy-cache插件
- APP免费
23.3.2 利用聚合拼接缓存资源
- APP免费
23.3.3 鉴权和缓存剥离
- APP免费
23.4 总结
- APP免费
第24章 高性能Varnish缓存系统
- APP免费
24.1 HTTP缓存对后端服务的价值分析
- APP免费
24.2 CDN缓存和Varnish缓存的共存模式
- APP免费
24.3 安装Varnish和所需模块
- APP免费
24.4 配置文件概览
- APP免费
24.5 稳定性建设所依赖的功能
- APP免费
24.5.1 神圣模式
- APP免费
24.5.2 宽限模式——异步缓存更新
- APP免费
24.5.3 更安稳的软清除
- APP免费
24.6 最佳实践
- APP免费
24.6.1 动态缓存时间配置
- APP免费
24.6.2 热Key及秒杀系统的缓存实践
- APP免费
24.6.3 后端服务故障转移
- APP免费
24.6.4 高并发下Varnish启动参数优化
- APP免费
24.6.5 Varnish配置模板优化实践
- APP免费
24.6.6 测试环境缓存系统的干扰事件
- APP免费
24.7 总结
- APP免费
第25章 SRE漏斗优化法则
- APP免费
25.1 SRE性能优化之漏斗优化法则
- APP免费
25.2 漏斗优化法则的技术栈梳理
- APP免费
25.2.1 减少访问量
- APP免费
25.2.2 减少返回的数据
- APP免费
25.2.3 减少交互次数
- APP免费
25.2.4 降低CPU、内存使用率
- APP免费
25.2.5 提升资源利用率
- APP免费
25.3 总结
- APP免费
第26章 awesome性能分析工具
- APP免费
26.1 站在巨人的肩膀上工作
- APP免费
26.1.1 系统性能分析常见清单
- APP免费
26.1.2 bcc-tools工具清单
- APP免费
26.1.3 火焰图
- APP免费
26.2 Netdata
- APP免费
26.3 总结
- APP免费
第27章 性能优化实践锦集
- APP免费
27.1 TIME_WAIT优化方案扩展
- APP免费
27.2 利用Ngx_Lua缩短请求链路
- APP免费
27.3 eBPF在Kubernetes上的应用
- APP免费
27.3.1 kubectl-trace
- APP免费
27.3.2 使用前提
- APP免费
27.3.3 使用优点
- APP免费
27.3.4 使用场景
- APP免费
27.3.5 安装
- APP免费
27.4 善用CDN
- APP免费
27.4.1 静态加速
- APP免费
27.4.2 动态加速
- APP免费
27.4.3 缓存过期保护策略
- APP免费
27.5 记一次中台服务优化实战
- APP免费
27.5.1 寻找优化目标
- APP免费
27.5.2 抽丝剥茧——尝试优化方案
- APP免费
27.5.3 使用go pprof火焰图发现端倪
- APP免费
27.5.4 回顾复盘
- APP免费
27.6 总结
- APP免费
扩展篇 在团队间搭建桥梁
- APP免费
第28章 业务开发人员视角下的技术风险
- APP免费
28.1 了解业务开发人员
- APP免费
28.1.1 工作内容
- APP免费
28.1.2 废弃十年如一日
- APP免费
28.1.3 重构并非易事
- APP免费
28.1.4 发布前的检查清单
- APP免费
28.1.5 站在巨人的肩膀上编程
- APP免费
28.1.6 拒绝伪需求
- APP免费
28.2 大淘客之旅
- APP免费
28.2.1 对话高层,达成共识
- APP免费
28.2.2 对话业务线负责人
- APP免费
28.2.3 重识目标,各个击破
- APP免费
28.2.4 技术氛围和激励政策
- APP免费
28.2.5 “曲线救国”的技术路线
- APP免费
28.3 总结
- APP免费
第29章 SRE视角全篇总结
- APP免费
29.1 齐心协力
- APP免费
29.1.1 关键要素
- APP免费
29.1.2 华山论剑
- APP免费
29.2 竞品分析——最后1公里
- APP免费
29.3 故障降级系统——来自监控的沟通艺术
- APP免费
29.3.1 抽象业务形态
- APP免费
29.3.2 抽象监控触发条件
- APP免费
29.3.3 收拢零散性的自愈任务
- APP免费
29.4 重识CMDB价值
- APP免费
29.5 总结
更新时间:2024-05-24 18:19:55