术语表 - Jimmy Song

以下是本文中涉及的 AI 和技术相关术语的详细解释，帮助读者更好地理解文章内容。

基础模型与架构

大语言模型（LLM - Large Language Model）：基于 Transformer 架构的深度学习模型，使用大规模文本语料库训练而成。这些模型具备强大的自然语言理解和生成能力，能够处理多种语言任务，如问答、翻译、摘要等。典型代表包括 GPT 系列、千问、Gemini 等。
基础模型（Foundation Models）：在大规模通用数据集上预训练、具备广泛适应能力的人工智能模型。大型语言模型（LLM）和多模态模型通常被视为基础模型。它们通过海量数据学习到丰富的知识和通用能力，能够作为各类下游任务的基础，通过微调或提示快速适配不同应用场景。
注意力机制（Attention Mechanism）：让模型能够动态关注输入数据中不同部分的机制。通过计算注意力权重，模型可以有选择地处理重要信息，提高对长序列数据的理解和生成能力。
自注意力（Self-Attention）：一种特殊的注意力机制，用于计算输入序列内部各元素之间的关联强度。它允许序列中的每个位置都能够直接与其他所有位置进行信息交互。

RAG 相关技术

检索增强生成（RAG - Retrieval-Augmented Generation）：一种混合 AI 架构，结合了信息检索和文本生成技术。RAG 在生成回答前先从外部知识库中检索相关信息，然后将检索到的内容作为上下文提供给生成模型，从而提高回答的准确性和相关性，减少幻觉问题。
向量化（Vectorization）：将文本、图像或其他数据转换为数值向量的过程。在 NLP 中，文本向量化通过嵌入模型将词语、句子或文档映射到高维向量空间，使计算机能够理解和处理语义信息。
嵌入模型（Embedding Model）：专门用于生成向量表示的机器学习模型。嵌入模型将离散的符号（如单词、句子）转换为连续的向量表示，捕获其语义特征。
文档分块（Chunking）：将长文档分割成较小、语义相对完整的文本片段的技术。分块是 RAG 系统中的关键步骤，好的分块策略需要平衡块的大小、语义完整性和检索效果。
向量数据库（Vector Database）：专门存储和检索高维向量数据的数据库系统。与传统关系数据库不同，向量数据库优化了相似度搜索功能。
语义检索（Semantic Search）：基于语义理解而非关键词匹配的信息检索技术。语义检索使用向量化技术将查询和文档转换为语义向量，通过计算向量相似度找到语义相关的内容。

提示工程技术

提示词工程（Prompt Engineering）：设计和优化输入提示以引导大语言模型生成期望输出的技术。
零样本提示（Zero-shot Prompting）：只向模型提供任务描述或问题，而不提供任何示例的提示方法。
单样本提示（One-shot Prompting）：在提示中为模型提供一个示例的方法。
少样本提示（Few-shot Prompting）：在提示中提供多个示例的技术。
系统提示（System Prompting）：用于设定语言模型整体行为和能力边界的提示技术。
角色提示（Role Prompting）：为语言模型分配特定角色或身份的提示技术。
思维链（Chain of Thought, CoT）：通过引导模型生成中间推理步骤来提升推理能力的提示技术。
思想树（Tree of Thoughts, ToT）：思维链的泛化形式，允许模型同时探索多个不同的推理路径。
回溯提示（Step-back Prompting）：引导模型先思考更一般或更高层次的背景问题的方法。

模型训练与优化

RLHF（人类反馈强化学习）：结合人类反馈与强化学习的训练方法。
微调（Fine-tuning）：在预训练模型基础上，使用特定领域或任务的数据进行再训练的技术。
预训练（Pre-training）：在大规模通用数据集上训练模型的过程。
知识蒸馏（Knowledge Distillation）：通过让小型模型学习大型模型的输出分布，实现知识转移。
低秩适应（LoRA）：一种高效的模型微调方法，通过注入低秩分解矩阵减少训练参数。

评估与度量

BLEU 分数：用于评估机器翻译和文本生成质量的指标。
ROUGE 指标：用于评估文本摘要和机器翻译质量的指标集。
余弦相似度（Cosine Similarity）：衡量两个向量间夹角余弦值的相似度指标。

系统架构与部署

边缘计算（Edge Computing）：将计算任务从集中式数据中心转移到网络边缘的分布式计算模式。
无服务器架构（Serverless Architecture）：开发者只需关注代码逻辑，无需管理服务器基础设施的云计算模式。
Cloudflare Workers：基于 V8 JavaScript 引擎的无服务器计算平台。
Vectorize：Cloudflare 提供的托管向量数据库服务。

AI 安全与伦理

提示注入攻击（Prompt Injection）：通过精心设计的输入内容绕过模型安全限制的攻击方式。
对齐（Alignment）：确保 AI 系统行为与人类价值观保持一致的过程。
安全性（Safety）：AI 系统避免产生有害行为的能力。
偏见（Bias）：AI 模型在训练数据或算法设计中存在的系统性偏差。

其他重要概念

多模态能力（Multimodal Capabilities）：处理文本、图像、音频等多种数据类型的能力。
幻觉（Hallucination）：模型生成看似合理但实际错误信息的现象。
Token：自然语言处理中的基本处理单元。
上下文窗口（Context Window）：模型能处理的最大 token 数量。
温度参数（Temperature）：控制语言模型生成随机性的超参数。
多轮对话（Multi-turn Conversation）：跨越多个交互轮次的对话模式。
AIGC（人工智能生成内容）：由 AI 系统自动生成的各类内容。

发布于: 2025/07/31 • 最后更新: 2025/08/05 • 编辑页面