LanceDB 是专为快速、可扩展和生产就绪的向量搜索而设计的数据库。它基于 Lance 列式格式构建,可以轻松存储、索引和搜索 PB 级的多模态数据和向量。LanceDB 是开发人员构建、训练和分析 AI 工作负载的中心位置。
主要特性
- 快速向量搜索:通过最先进的索引技术,在毫秒内搜索数十亿个向量
- 全面搜索:支持向量相似性搜索、全文搜索和 SQL
- 多模态支持:存储、查询和过滤向量、元数据和多模态数据(文本、图像、视频、点云等)
- 高级功能:零拷贝、自动版本管理,无需额外基础设施即可管理数据版本。在构建向量索引时支持 GPU
产品
- 开源与本地:100% 开源,可在本地或云中运行,无供应商锁定
- 云和企业版:生产级向量搜索,无需管理服务器,完全的数据主权和安全性
生态系统
- 列式存储:基于 Lance 列式格式,实现高效存储和分析
- 无缝集成:提供 Python、Node.js、Rust 和 REST API 便于集成,原生支持 Python 和 JavaScript/TypeScript
- 丰富生态:与 LangChain 🦜️🔗、LlamaIndex 🦙、Apache-Arrow、Pandas、Polars、DuckDB 等集成,更多集成正在路上