简介
Vespa 是一个面向在线 AI 与大数据的分布式服务框架,擅长在低延迟场景中提供检索与推理能力,支持向量搜索、复杂查询与自定义评分函数。它常用于需要大规模索引和实时查询的场景,例如推荐、搜索和语义检索服务。
主要特性
- 向量与文本混合检索:支持高性能向量搜索与布尔/近似最近邻混合查询。
- 实时索引:支持近实时数据写入与查询。
- 扩展性:分布式架构可水平扩展到大规模数据集与请求量。
使用场景
- 语义搜索与 RAG 系统的检索层。
- 推荐系统与在线个性化服务。
- 低延迟在线推理与服务化模型调用。
许可证与维护
- 采用 Apache-2.0 许可证,适合企业与开源社区共同使用与贡献。