草稿

AI 原生应用构建实战

本篇将所有核心能力串联成可直接复用的实战模板:从需求拆解、数据准备、系统架构,到实现步骤、质量评测、上线运维,配套 Checklist 与脚本清单,帮助你高效交付 AI 项目。

章节目录

AI 原生应用架构简介

草稿

探索 AI 原生应用架构,了解其核心特征、发展背景及成熟度,助力智能决策与持续优化。

本地开发环境搭建

草稿

指导开发者如何在本地搭建和配置 AI 开发环境,包括工具、库和最佳实践。

LLM 推理与调度实操

草稿

本文介绍如何在无 GPU 的 Mac Mini M4 上,结合 Ollama、vLLM 和 FastAPI,构建本地 LLM 问答服务并部署到 Kubernetes,涵盖架构设计、开发流程与常见问题排查。

降低幻觉

草稿

探索幻觉降低与可靠性工程的实用指南,提升 RAG 系统与 Agent 应用的可靠性与透明度,确保输出的准确性与可追溯性。

PyTorch 入门与性能分析

草稿

云原生工程师视角下,梳理 PyTorch/TensorFlow 训练与推理流程,示例代码与性能分析方法,涵盖分布式训练实践。

SGLang 工程化与性能优化

草稿

深入探讨 SGLang 的工程实践与性能优化,涵盖推理服务能力、部署方案、性能评估与优化方法等关键内容。

Hugging Face LoRA 微调

草稿

介绍如何用 Hugging Face Transformers 和 PEFT 的 LoRA 方法高效微调大语言模型,降低资源需求,实现个性化定制。

SGLang 结构化输出与函数调用

草稿

介绍 SGLang 的结构化输出与函数调用能力,简化生成式 AI 工作流,提升内容生成与数据处理效率。

应用开发模板

草稿

探索 AI 应用开发模板,提升项目结构与效率,减少重复工作,快速上手,助力成功实现 AI 项目。

开源模型结构与微调实战

草稿

通过 Qwen3-4B-Instruct-2507 模型示例,详细说明开源大模型的文件结构、加载方式与 LoRA/QLoRA 微调流程。