《智能体设计模式》中文版已发布, 点击阅读

TEN Framework

面向实时多模态对话与语音代理的开源框架与生态,提供示例、工具与运行时支持。

详细介绍

TEN Framework 是一个面向实时、多模态对话与语音代理的开源生态,涵盖核心运行时、示例 agent、声音活动检测、转写与唤醒等组件。项目提供从本地容器到云端部署的完整示例与开发指南,帮助团队快速构建低延迟、可扩展的语音和视频交互系统。

主要特性

  • 丰富的 agent 示例(实时语音助手、唇同步头像、SIP 通话等),便于快速复现完整应用场景。
  • 支持多模态能力(音频、视频、文本)与低延迟音频处理模块。
  • 模块化设计与多语言文档,包含完善的部署与开发流程说明。

使用场景

  • 实时语音助手与客服机器人,要求低延迟与连续对话能力。
  • 嵌入式或边缘设备的语音交互(例如 ESP32-S3 等示例)。
  • 面向媒体与娱乐的唇同步与虚拟形象交互场景。

技术特点

  • 多语言实现与混合语言栈(C/Python/TypeScript/Rust),便于在不同平台集成。
  • 模块化运行时与插件化中间件,支持自定义音频处理、模型与第三方服务连接。
  • 开源许可与活跃社区,提供长期维护与示例生态。

评论区

TEN Framework
资源信息
🌱 开源 🎨 多模态 🔊 音频 🎬 视频