详细介绍
Below 是一个针对现代 Linux 系统的“时光旅行”式资源监控工具,设计用于查看与记录系统运行时的历史数据。它支持实时(live)观察、记录(record)守护进程、以及回放(replay)历史快照,方便在事后对性能事件、资源使用趋势与 cgroup 层级进行深度分析。Below 将系统指标以可脚本化的格式导出,适合与现有监控生态(例如 Prometheus/Grafana)集成。
主要特性
- 支持多种工作模式:
live(实时查看)、record(持续记录)、replay(回放历史)与dump(脚本友好输出,如 JSON/CSV/OpenMetrics)。 - 能记录并重放系统级别的资源利用信息,包括进程、cgroup 层次结构与压力等待信息(PSI)。
- 提供可复现的 snapshot 文件用于问题重现与离线分析。
- 以 Rust 实现的高性能二进制,可通过包管理器或 Docker 镜像获取并部署。
使用场景
- 现场故障调查:通过回放历史记录定位短暂或间歇性的问题。
- 性能回归分析:记录基准运行并在不同时间点回放以比较指标差异。
- 集群与容器监控:与 Prometheus/Grafana 集成,作为补充的事件回溯工具。
- 自动化测试与基准:生成快照用于 CI 中的回放与验证。
技术特点
- 主要用 Rust 开发,追求低开销与高可靠性。
- 面向脚本化与可导出格式,支持 JSON、CSV 与 OpenMetrics 等输出。
- 支持并依赖于现代 cgroup 与内核指标(注意:不支持 cgroupv1)。
- 提供 Docker 镜像与多数主流发行版的软件包,便于在多种环境中部署与集成。