企业级 AI 平台化与多智能体基础设施演进

平台化的本质，是用系统工程思维重塑 AI 的可扩展性与协作边界。

前言

AI 的快速普及，让越来越多的企业开始从“功能性 AI 应用”走向“平台化 AI 基础设施”的建设。与早期孤立的模型调用或 prompt 实验不同，企业级 AI 平台化的核心目标是可扩展性、可治理性与复用性。

LinkedIn、Uber、OpenAI、DoorDash 等公司都在逐步形成自己的“AI 平台栈（AI Platform Stack）”，实现从模型到智能体（Agent）的工程化演进。

本文将以 LinkedIn 的平台化实践为蓝本，抽象企业在建设 AI 平台与多智能体基础设施时的通用模式、技术栈结构与组织演进规律。

平台化的起点：从孤立实验到统一栈

在 AI 早期落地阶段，不同业务团队往往各自尝试使用大模型构建小功能模块。例如：

内容生成、摘要、问答
招聘助手、邮件撰写助手
文档分析、语义推荐等

这些 “孤岛式实验” 通常直接在应用层封装模型调用，没有统一的 Prompt、技能（Skill，技能）、记忆（Memory，记忆）体系。

结果是：

每个团队都在重复构建相似的调用逻辑
Prompt 无法共享或治理
无法形成跨产品的数据与智能积累

企业级平台化的第一步，就是要打破这种分散实验状态，实现应用栈（Application Stack）统一，为后续的治理与复用打下基础。

AI 应用栈的核心层次

企业级 AI 平台的技术架构可以分为多个核心层次。下图以 Mermaid 图形式展示了 LinkedIn 等企业的典型平台分层：

每一层都承担着不同的职责，下面对各层进行简要说明。

模型接入与治理层（Model & Policy Layer）

该层为企业提供统一的模型接入网关（可兼容 OpenAI API 规范），支持外部 API（如 OpenAI、Claude、Gemini）与内部微调模型共存，并引入负责任 AI（Responsible AI）机制，如内容审查、配额控制、日志追踪等。

应用栈（Application Stack）

在应用栈层，企业通常会统一开发语言（如 LinkedIn 选择全 Python 化，以 LangChain 为核心框架），通过内部 SDK 抽象标准接口，避免锁定具体框架。基础组件包括：

Prompt Source of Truth（提示词真源系统）
Skill Registry（技能注册中心）
Memory Layer（记忆系统）

Agent 框架层（Agent Framework）

该层通过 LangGraph 或自研 DSL 实现任务分解、工具调用、状态追踪，并提供 Agent Schema（输入/输出契约）与生命周期管理能力。

多智能体编排层（Multi-Agent Orchestration）

多智能体编排层利用企业现有基础设施（如 Messaging、Kafka、EventBus）实现 Agent 间通信，支持异步、流式、多线程任务调度，并内置 Human-in-the-Loop（HITL，人类参与环节）审批节点，实现人机协同控制。

平台治理与观测层（Governance & Observability）

该层在开发阶段使用 LangSmith 进行追踪与调试，生产环境则采用 OpenTelemetry（OTel）进行端到端可观测性，并提供 Playground、评测体系与审计追踪能力。

Prompt、Skill、Memory 的三维体系

在企业级 AI 平台中，Prompt、Skill 与 Memory 是 AI 智能的三大中枢。下表总结了三者的主要职责与平台化目标：

中枢	主要职责	平台化目标
Prompt Source of Truth	统一模板、版本控制、审核	实现可治理的 PromptOps
Skill Registry	定义模型可调用的 API / 工具	形成标准化的 API 能力图谱
Memory System	存储交互上下文与经验偏好	支撑个性化与长期上下文

表 1: AI 平台三大中枢体系

在实际工程中，Prompt 层通常通过 Jinja 模板集中管理，配合版本灰度发布。Skill 层引入自动注册与人工审查机制，避免重复定义。Memory 层则分为会话上下文（Conversational Memory）和经验记忆（Experiential Memory），未来趋势是整合为“统一认知记忆层（Unified Cognitive Memory）”，以增强 Agent 的长期上下文与个性化能力。

从 Assistant 到 Agent：企业智能体的演化逻辑

企业平台从“助手（Assistant）”升级为“智能体（Agent）”，两者在能力与适用场景上存在明显差异。下表对比了两者的主要特征：

类型	特点	适用场景
Assistant	单轮问答、任务受限、Prompt 驱动	内容生成、问答、摘要
Agent	多步推理、任务分解、技能调用、自主执行	招聘助手、分析决策、运维优化

表 2: Assistant 与 Agent 对比

设计企业级 Agent 时，需关注以下要点：

明确任务契约（Contract）：每个 Agent 有输入/输出 Schema
注册与发现（Registry）：Agent 被注册到平台中心，支持复用
编排机制（Orchestration）：借助消息系统协调多 Agent 工作
人机协同（HITL）：关键决策需人工确认，保证可控性
可观测性：所有推理步骤与调用链都可追踪

AI 可观测性与工程化反馈闭环

AI 系统的复杂性在于其不仅是软件系统，还包含非确定性的模型行为。因此，可观测性（Observability）成为 AI 平台的工程生命线。

下图展示了 LinkedIn 的双层观测体系：

通过 LangSmith（开发期）和 OpenTelemetry（生产期）的组合，工程团队可以对非确定性 LLM 行为进行可重放、可解释、可评估的调试，形成持续反馈闭环。

组织与文化的协同演进

平台化不仅是技术问题，更是组织演化问题。LinkedIn 在迁移过程中采取了三种有效机制：

语言文化迁移：从 Java 向 Python 生态切换，配合内部培训与结对开发
平台即产品（Platform-as-Product）思维：把开发者当“客户”，强调 DX（Developer Experience）
渐进式迁移：从单一原型到小范围应用，再到全平台推广，避免大规模重构风险

这种技术与组织的协同演进，是平台化成功的关键保障。

未来趋势：开放协议与 Agent 互操作

未来的企业级 AI 平台将不再是封闭系统，而是基于开放协议互联的智能网络。下表列举了当前关键协议及其作用：

协议	作用	支持者
MCP（Model Context Protocol）	标准化模型与工具的上下文交换接口	OpenAI, Anthropic, LinkedIn
A2A（Agent-to-Agent Protocol）	使不同 Agent 框架互通	Google, LinkedIn 等
LLM Gateway API	统一模型接入层	Azure, OpenAI, AWS Bedrock 等

表 3: 主流开放协议与支持者

这意味着未来的 AI 平台将走向“多智能体互操作网络（Interoperable Agent Network）”，而非单一平台内部的封闭生态。

总结

企业级 AI 平台化的本质是系统工程。它要求在技术、数据、组织、文化等多维度协同演进，目标不是替代人类，而是让 AI 增强工程师能力，让平台放大人类判断力。这正是“AI 原生基础设施”的灵魂所在。

参考文献

The Evolution of LinkedIn’s Generative AI Tech Stack - blog.bytebytego.com

发布于: 2025/11/03 • 最后更新: 2025/11/04 • 字数: 2602 • 阅读时间: 6 mins