📚 构建长期复利型知识基础设施的指南,详见 RAG 实战手册

IntraScribe

可内网私有化部署的语音转写与协作平台,支持实时转写、说话人分离、批处理转写与 AI 总结。

简介

IntraScribe 是一个面向企业、学校与机关等需要内网部署或隐私保护的团队的语音转写与协作平台。项目支持实时转写(WebRTC)、说话人分离、高质量批处理转写,以及基于模板的 AI 总结与标题生成。设计强调可替换的采集与传输方案、微服务化后端以及数据留在内网的部署策略,适合对合规与数据安全有较高要求的场景。

主要特性

  • 内网优先与隐私保护:支持离线或内网环境部署,数据不外发,便于合规管理。
  • 实时转写与低延迟返回:浏览器或边缘设备通过 WebRTC 接入,实现实时转写片段推送与订阅。
  • 说话人分离与编辑:基于 pyannote.audio 的说话人分离,支持前端重命名与保存。
  • 批处理高质量转写:会话结束后进行批处理与重转写,提升转写质量并生成结构化结果。
  • AI 总结与模板:集成 LiteLLM 支持按模板生成结构化 Markdown 总结与简洁标题。

使用场景

  • 企业或政府机关的会议记录与知识沉淀,要求数据留在内网并具备审计能力。
  • 学校课堂与研讨会的课堂记录,支持多人说话人标注与文本编辑。
  • 生产现场或指挥中心等对延迟与隐私敏感的语音采集场景。

技术特点

  • 前端:Next.js + React + TypeScript,支持 WebRTC 与 SSE 实时通道。
  • 后端:微服务化架构,主服务基于 FastAPI,包含 STT、Diarization、Agent 等独立服务,支持 GPU 加速的模型调用。
  • 存储与实时:使用 Supabase(Postgres + Auth + Storage + Realtime)管理数据与订阅。
  • 可扩展模型:支持替换 STT 模型(如 FunASR)与轻量级 LLM(LiteLLM)用于摘要与标题生成。

评论区

IntraScribe
资源信息
🌱 开源 🔊 音频 📱 应用