术语表

以下是本文中涉及的 AI 和技术相关术语的详细解释,帮助读者更好地理解文章内容。

基础模型与架构

  • 大语言模型(LLM - Large Language Model):基于 Transformer 架构的深度学习模型,使用大规模文本语料库训练而成。这些模型具备强大的自然语言理解和生成能力,能够处理多种语言任务,如问答、翻译、摘要等。典型代表包括 GPT 系列、千问、Gemini 等。

  • 基础模型(Foundation Models):在大规模通用数据集上预训练、具备广泛适应能力的人工智能模型。大型语言模型(LLM)和多模态模型通常被视为基础模型。它们通过海量数据学习到丰富的知识和通用能力,能够作为各类下游任务的基础,通过微调或提示快速适配不同应用场景。

  • 注意力机制(Attention Mechanism):让模型能够动态关注输入数据中不同部分的机制。通过计算注意力权重,模型可以有选择地处理重要信息,提高对长序列数据的理解和生成能力。

  • 自注意力(Self-Attention):一种特殊的注意力机制,用于计算输入序列内部各元素之间的关联强度。它允许序列中的每个位置都能够直接与其他所有位置进行信息交互。

RAG 相关技术

  • 检索增强生成(RAG - Retrieval-Augmented Generation):一种混合 AI 架构,结合了信息检索和文本生成技术。RAG 在生成回答前先从外部知识库中检索相关信息,然后将检索到的内容作为上下文提供给生成模型,从而提高回答的准确性和相关性,减少幻觉问题。

  • 向量化(Vectorization):将文本、图像或其他数据转换为数值向量的过程。在 NLP 中,文本向量化通过嵌入模型将词语、句子或文档映射到高维向量空间,使计算机能够理解和处理语义信息。

  • 嵌入模型(Embedding Model):专门用于生成向量表示的机器学习模型。嵌入模型将离散的符号(如单词、句子)转换为连续的向量表示,捕获其语义特征。

  • 文档分块(Chunking):将长文档分割成较小、语义相对完整的文本片段的技术。分块是 RAG 系统中的关键步骤,好的分块策略需要平衡块的大小、语义完整性和检索效果。

  • 向量数据库(Vector Database):专门存储和检索高维向量数据的数据库系统。与传统关系数据库不同,向量数据库优化了相似度搜索功能。

  • 语义检索(Semantic Search):基于语义理解而非关键词匹配的信息检索技术。语义检索使用向量化技术将查询和文档转换为语义向量,通过计算向量相似度找到语义相关的内容。

提示工程技术

  • 提示词工程(Prompt Engineering):设计和优化输入提示以引导大语言模型生成期望输出的技术。

  • 零样本提示(Zero-shot Prompting):只向模型提供任务描述或问题,而不提供任何示例的提示方法。

  • 单样本提示(One-shot Prompting):在提示中为模型提供一个示例的方法。

  • 少样本提示(Few-shot Prompting):在提示中提供多个示例的技术。

  • 系统提示(System Prompting):用于设定语言模型整体行为和能力边界的提示技术。

  • 角色提示(Role Prompting):为语言模型分配特定角色或身份的提示技术。

  • 思维链(Chain of Thought, CoT):通过引导模型生成中间推理步骤来提升推理能力的提示技术。

  • 思想树(Tree of Thoughts, ToT):思维链的泛化形式,允许模型同时探索多个不同的推理路径。

  • 回溯提示(Step-back Prompting):引导模型先思考更一般或更高层次的背景问题的方法。

模型训练与优化

  • RLHF(人类反馈强化学习):结合人类反馈与强化学习的训练方法。

  • 微调(Fine-tuning):在预训练模型基础上,使用特定领域或任务的数据进行再训练的技术。

  • 预训练(Pre-training):在大规模通用数据集上训练模型的过程。

  • 知识蒸馏(Knowledge Distillation):通过让小型模型学习大型模型的输出分布,实现知识转移。

  • 低秩适应(LoRA):一种高效的模型微调方法,通过注入低秩分解矩阵减少训练参数。

评估与度量

  • BLEU 分数:用于评估机器翻译和文本生成质量的指标。

  • ROUGE 指标:用于评估文本摘要和机器翻译质量的指标集。

  • 余弦相似度(Cosine Similarity):衡量两个向量间夹角余弦值的相似度指标。

系统架构与部署

  • 边缘计算(Edge Computing):将计算任务从集中式数据中心转移到网络边缘的分布式计算模式。

  • 无服务器架构(Serverless Architecture):开发者只需关注代码逻辑,无需管理服务器基础设施的云计算模式。

  • Cloudflare Workers:基于 V8 JavaScript 引擎的无服务器计算平台。

  • Vectorize:Cloudflare 提供的托管向量数据库服务。

AI 安全与伦理

  • 提示注入攻击(Prompt Injection):通过精心设计的输入内容绕过模型安全限制的攻击方式。

  • 对齐(Alignment):确保 AI 系统行为与人类价值观保持一致的过程。

  • 安全性(Safety):AI 系统避免产生有害行为的能力。

  • 偏见(Bias):AI 模型在训练数据或算法设计中存在的系统性偏差。

其他重要概念

  • 多模态能力(Multimodal Capabilities):处理文本、图像、音频等多种数据类型的能力。

  • 幻觉(Hallucination):模型生成看似合理但实际错误信息的现象。

  • Token:自然语言处理中的基本处理单元。

  • 上下文窗口(Context Window):模型能处理的最大 token 数量。

  • 温度参数(Temperature):控制语言模型生成随机性的超参数。

  • 多轮对话(Multi-turn Conversation):跨越多个交互轮次的对话模式。

  • AIGC(人工智能生成内容):由 AI 系统自动生成的各类内容。

文章导航

独立页面

这是书籍中的独立页面。

书籍首页