nanoGPT

一个简洁且高效的仓库，用于训练与微调中等规模的 GPT 模型，适合教学与实验。

Andrej Karpathy · Since 2022-12-28

正在加载评分...

详细介绍

nanoGPT 是由 Andrej Karpathy 发布的简洁、高效的 GPT 训练与微调仓库，面向中等规模模型与教育用途。它以清晰的实现与少量依赖著称，帮助研究者与工程师快速上手 Transformer 训练流程、数据预处理与优化技巧，同时适合作为教学示例与原型开发基础。

nanoGPT 基于 Python 实现，面向可读性与可实验性，适合作为入门到中级的实践仓库。项目采用 MIT 许可证，社区活跃，广泛用于教育、研究与小规模产品探索。