《智能体设计模式》中文版已发布, 点击阅读

Lingua

Meta Lingua:一个轻量且面向研究的 LLM 训练与推理库,便于快速试验新结构与度量。

简介

Meta Lingua(lingua)是 Facebook Research 开发的轻量级 LLM 训练与推理库,旨在为研究人员提供可快速修改的 PyTorch 组件,以便尝试新架构、损失与数据处理管线,同时关注速度与稳定性分析。

主要特性

  • 端到端训练与推理:内置训练、评估与导出工具,包含示例配置与启动脚本。
  • 分布式与 SLURM 支持:提供方便的 stool 工具与 SLURM 工作流集成,支持多 GPU 并行训练。
  • 可扩展组件:模块化的 transformer、优化器、数据加载与检查点管理,便于研究扩展。
  • 性能与剖析工具:内置 profiling 支持 MFU/HFU 统计与内存追踪。

使用场景

  • LLM 研究原型:快速搭建实验并比较不同架构的可扩展性与性能。
  • 小规模训练:在少量 GPU 上对新想法进行迭代验证。
  • 教学与示例:作为可解释且简洁的代码基准用于教学与研究复现。

技术特点

  • 基于 PyTorch 的纯实现,便于阅读与修改。
  • 使用 dataclass 配置与 CLI 参数覆盖,方便实验配置与复现。
  • 提供详细文档、示例脚本与引用信息,便于学术引用与工程对接。

评论区

Lingua
资源信息
🌱 开源 🖥️ 机器学习平台