Delta Lake

An open-source storage framework enabling Lakehouse architectures with engines like Spark, Presto, Flink and Trino.

Author: Delta Lake

Since: 2019-04-22

Delta Lake is an open-source storage framework designed for analytic workloads, providing transactional guarantees, observability, and reliable data management for Lakehouse architectures. It enables ACID transactions, time travel, and concurrency control, improving consistency and reliability for engines like Spark, Trino, and Flink.

Key features

ACID transactions and consistency: Support concurrent writes and atomic commits to minimize inconsistency.
Time travel: Query historical data versions for auditing and rollback.
High performance: Optimized storage and scanning strategies based on Parquet.
Multi-engine support: Works with Spark, Flink, Presto/Trino and other ecosystem tools.

Use cases

Building Lakehouse architectures: Unify storage and compute for analytics workloads.
Data engineering and ETL: Reliable write semantics and versioning for large-scale pipelines.
Compliance and auditing: Use time travel and transaction logs for governance.

Technical highlights

Active open-source community and a wide range of ecosystem integrations.
Comprehensive documentation, migration guides, and production deployment patterns.

Delta Lake

Key features

Use cases

Technical highlights

Resource Info

Related Resources

Infinity

Parsr

Rhesis