已完成

AI 基础知识

本章帮助你快速掌握 AI 的基础概念与常用实战要点,适合作为入门复习手册。先介绍核心概念,再逐步覆盖模型、训练、评估、数据处理与工程化注意点,最后给出总结与参考链接,便于后续深挖。

章节目录

大模型技术全景

已完成

梳理 AI 技术体系的核心模块、能力分层与云原生工程师的成长路径,帮助理解 AI 与云原生架构的深度融合。

机器学习基础

已完成

系统介绍机器学习(Machine Learning, ML)的基本概念、常用模型及其在实际应用中的角色,帮助读者建立 AI 基础认知。

大模型工作原理

已完成

介绍大模型从训练到推理的全过程,涵盖 Transformer 结构、RLHF、RAG 及推理加速等关键环节,帮助读者理解模型如何“思考”。

Transformer

已完成

用云原生工程师视角,深入浅出理解 Transformer 架构及其核心机制,无需数学基础也能掌握大模型底层原理。

注意力机制

已完成

用云原生工程师视角,深入理解注意力机制(Attention),掌握 Transformer 和大语言模型的核心调度算法。

KV 缓存

已完成

深入理解 KV Cache 如何加速大语言模型推理,掌握 vLLM、TensorRT-LLM 等推理引擎的核心优化原理。

人类反馈强化学习

已完成

深入理解 RLHF 如何让大模型行为对齐人类价值,掌握 SFT、奖励模型和 PPO 的工程原理与流程。

预训练

已完成

系统梳理大语言模型预训练(Pre-training, 预训练)阶段的目标、流程、数据规模与工程要点,帮助理解基础模型能力的来源。

微调

已完成

系统梳理大语言模型微调(Fine-Tuning)阶段的目标、主流方法、工程流程与数据准备,帮助理解如何让模型适应特定任务与风格。

模型训练的工程化路径

已完成

系统梳理大语言模型训练的工程化流程、关键挑战与架构演化,帮助理解现代 AI 训练为何是最复杂的软件工程实践。