主页 图书/教程 AI 原生应用架构 基础知识 目录 已完成AI 基础知识 内容导航 图书内部搜索... 本文暂无目录本章帮助你快速掌握 AI 的基础概念与常用实战要点,适合作为入门复习手册。先介绍核心概念,再逐步覆盖模型、训练、评估、数据处理与工程化注意点,最后给出总结与参考链接,便于后续深挖。章节目录大模型技术全景 已完成梳理 AI 技术体系的核心模块、能力分层与云原生工程师的成长路径,帮助理解 AI 与云原生架构的深度融合。机器学习基础 已完成系统介绍机器学习(Machine Learning, ML)的基本概念、常用模型及其在实际应用中的角色,帮助读者建立 AI 基础认知。大模型工作原理 已完成介绍大模型从训练到推理的全过程,涵盖 Transformer 结构、RLHF、RAG 及推理加速等关键环节,帮助读者理解模型如何“思考”。Transformer 已完成用云原生工程师视角,深入浅出理解 Transformer 架构及其核心机制,无需数学基础也能掌握大模型底层原理。注意力机制 已完成用云原生工程师视角,深入理解注意力机制(Attention),掌握 Transformer 和大语言模型的核心调度算法。KV 缓存 已完成深入理解 KV Cache 如何加速大语言模型推理,掌握 vLLM、TensorRT-LLM 等推理引擎的核心优化原理。人类反馈强化学习 已完成深入理解 RLHF 如何让大模型行为对齐人类价值,掌握 SFT、奖励模型和 PPO 的工程原理与流程。预训练 已完成系统梳理大语言模型预训练(Pre-training, 预训练)阶段的目标、流程、数据规模与工程要点,帮助理解基础模型能力的来源。微调 已完成系统梳理大语言模型微调(Fine-Tuning)阶段的目标、主流方法、工程流程与数据准备,帮助理解如何让模型适应特定任务与风格。模型训练的工程化路径 已完成系统梳理大语言模型训练的工程化流程、关键挑战与架构演化,帮助理解现代 AI 训练为何是最复杂的软件工程实践。