简介
Maestro 是面向视觉与多模态模型的微调工具,提供统一的 CLI/SDK、训练配方(recipes)以及一致的 JSONL 数据格式,简化 Florence-2、PaliGemma 2 与 Qwen2.5-VL 等模型的微调流程。
主要特性
- 训练配方与可复现实验框架,封装数据准备、训练循环与指标计算。
- 支持 LoRA、QLoRA 与图冻结优化以降低硬件需求,并提供可复现的实验管理。
- 提供命令行与 Python 接口,配合 Colab 教程快速上手。
使用场景
- 快速微调视觉语言模型(VLM)进行目标检测、JSON 数据抽取或图像标注任务。
- 教学与研究场景的可复现实验平台。
- 在资源受限环境下进行高效微调与模型适配。
技术特点
- 兼容主流 VLM(如 Florence-2、Qwen2.5-VL),支持多种量化与优化策略,提供 cookbook/Colab 教程以便快速复现实验。