建设中

RAG 工程

RAG(Retrieval-Augmented Generation,检索增强生成)让大语言模型具备“查阅资料”的能力。本章按“数据准备 → 向量化 → 检索策略 → 评测迭代”四步拆解,提供工程化落地所需的脚本、流程和评估指标。

章节目录

概述

已完成

深入理解 RAG 如何让大模型实时访问外部知识库,实现动态知识增强和私有数据接入。

向量与文本表示

已完成

本章系统讲解 Embedding(向量)在 RAG 语义检索中的作用、原理、常见类型、参数选择与工程实践。

向量数据库选型

已完成

主流向量数据库的架构与选型策略,助力 RAG 系统工程落地。

文档处理

已完成

详细介绍将文档转换为 AI 知识库的完整流程,包括分片策略、向量化方法和索引构建。

框架实践

已完成

深入学习 LangChain 和 LlamaIndex 框架的使用方法和集成策略。

最佳实践

已完成

总结 RAG 系统开发中的最佳实践和避坑指南,提升系统性能和可靠性。

RAG 可观测性

已完成

系统化讲解 RAG(检索增强生成)可观测性方法,涵盖指标、日志、追踪与专用工具,助力构建可控、可解释的智能体系统。

Agentic RAG

待处理

使用 Milvus、LangChain 和 LangGraph 构建具备智能决策循环的 RAG 系统,实现多轮检索与自动 query 重写。