简介
Pezzo 是一个开源、面向开发者的云原生 LLMOps 平台,帮助团队管理提示、监控 AI 运行、调试问题并快速交付模型相关更改,适用于需要可观测性与协作流程的生产环境。
主要特性
- 提示管理与版本控制,便于多人协作与快速回滚。
- 丰富的可观测性与监控能力,帮助排查延迟、错误与成本热点。
- 支持缓存与优化策略以降低调用成本与响应延迟。
- 提供 console 与 Docker Compose 快速部署示例,支持多种后端与数据库(Postgres、ClickHouse、Redis 等)。
使用场景
- 企业级 LLMOps 平台:集中管理 prompt、监控模型行为与分发配置变更。
- 开发与测试环境:快速在本地或 Docker Compose 中启动完整堆栈进行调试。
- 成本优化:通过缓存与可观测性减少不必要的模型调用与开销。
技术特点
- 使用 TypeScript 与 Node.js 构建,提供服务端与 Console UI;代码托管在 GitHub,采用 Apache-2.0 许可证。
- 支持容器化部署(Docker Compose),并与主流向量存储及数据库集成以实现 RAG 与数据持久化。
- 文档齐全(https://docs.pezzo.ai/),并提供示例 repo 与演示动画以便快速上手。