已完成

大模型时代的开源生态

开源正在重塑大模型的格局。过去几年,全球开源社区涌现出一批具有影响力的项目——从 Llama、Mistral 到 ChatGLM、Baichuan、Qwen、DeepSeek 等,为开发者提供了可控、透明且高性能的模型选择。与此同时,围绕推理和部署的工具生态(如 vLLM、Ollama、llama.cpp)快速成熟,显著降低了模型落地成本。

本章聚焦开源大模型生态的结构与趋势:

  • 概览主流模型的特点与适用场景(通用对话、代码生成、多模态等);
  • 比较推理工具与部署框架的工程差异;
  • 分析生态活跃度、许可证类型与社区演化趋势。

目标不是列举模型,而是帮助开发者在复杂的生态中快速定位合适方案,理解开源模型的真实边界与工程可行性。

章节目录

新时代的开源

已完成

大模型时代“开源”定义正在变化,开放权重与论文是否等同于开源?本文深入分析传统软件开源与 AI 模型开源的差异与演进。

开源生态

已完成

探索大模型领域开源社区的动态与发展,了解其在推动技术创新与协作方面的作用

模型概览

已完成

全面了解当前具有重要影响的开源大语言模型(LLM),包括 Llama、ChatGLM、Baichuan、Qwen、DeepSeek、Mistral 等,助力工程师高效选型。

推理系统

已完成

全面梳理主流大模型推理系统的三层架构、工程定位与适用场景,助你精准选型与理解各自优势。

模型评估

已完成

系统梳理了大语言模型(LLM)主流评估方法,包括多项选择、验证器、排行榜与 LLM 评审,并配以从零实现的代码示例,帮助你理解各自的优缺点与适用场景。

模型选型

已完成

选择适合微调的模型:Llama、Qwen、Mistral、Phi、Deepseek 或 Gamma?实用建议帮你做出明智选择。