Gravitino

A high-performance, geo-distributed and federated metadata lake for unified metadata access and governance of data and AI assets.

Apache · Since 2023-04-23

Loading score...

GitHub Website

Gravitino is a metadata lake solution designed for large-scale data and AI scenarios. It provides a unified metadata model, federated query and governance features across regions, focusing on unifying metadata for tables, models, features, lineage, and model artifacts to support discovery, audit, access control, and AI asset management.

Key features

Unified metadata model: Abstracts metadata from different stores and services into a consistent model for easier discovery and governance.
Federated and geo-distributed: Native support for multi-region deployments and cross-domain synchronization.
Governance and auditing: Built-in access controls, audit logs, and policy mechanisms to meet compliance and security requirements.
Multi-engine compatibility: Integrates with engines like Trino and Spark and supports table formats such as Iceberg.

Use cases

Unified metadata portal: Provide cross-lake and cross-repository metadata search and management for data engineers and data scientists.
AI asset management: Track models, features, datasets, their lineage and versions to support reproducible ML lifecycles.
Multi-region synchronization: Keep metadata consistent and policies synchronized across multi-cloud and multi-region environments.

Technical highlights

Scalable service design to handle high-concurrency metadata queries and changes.
Rich set of connectors to collect metadata from databases, object stores, and table formats.
Comprehensive documentation and a Docker Compose playground for quick evaluation.

Core Content

Core Content

Technology

Technology

More

More

AI Infrastructure

AI Infrastructure

Explore

Explore

Connect

Connect

Quick Links

Quick Links

LinkedIn

LinkedIn

Follow on X

Follow on X

Gravitino

Key features

Use cases

Technical highlights

Score Breakdown

Related Resources

Apache Doris

Apache Iceberg

3FS