我的 Personal AI Stack:每月 700 元构建一个持续运行的个人 AI 基础设施

我如何用 ChatGPT、OpenClaw、Obsidian、GitHub、飞书、GLM-5.1 和 Mac mini M4 构建一套个人 AI 基础设施。

个人 AI 基础设施不是单一工具,而是长期协同的系统。

图 1: 我的 Personal AI Stack
图 1: 我的 Personal AI Stack

很多人在讨论 AI Agent、第二大脑(Second Brain)、个人知识管理(PKM)和数字分身。

但过去一年,我逐渐意识到,我真正构建的并不是某个 AI 助手,而是一套持续运行的个人 AI 基础设施(Personal AI Infrastructure)。

它不是某个产品,也不是某个模型,而是一组长期协同工作的系统。

这套系统每天帮助我思考、研究、写作、开发、管理知识、处理邮件、维护网站,并持续积累长期记忆。

如果用一句话概括:

ChatGPT 负责思考,OpenClaw 负责执行,Obsidian 负责记忆,GitHub 负责发布。

从工具到基础设施

大部分 AI 工作流文章的结构都差不多,先讲模型、插件、编辑器。

但我越来越觉得,工具不是重点。

重点是这些工具如何协同工作。

我的工作横跨:

  • AI 基础设施研究
  • 开源社区运营
  • 技术写作
  • Developer Relations
  • 产品与生态建设

每天都会产生大量信息:

  • ChatGPT 对话
  • 技术研究
  • GitHub 活动
  • 社区讨论
  • 邮件订阅
  • Hacker News
  • Discord
  • 微信和飞书消息

问题从来不是缺少信息,而是如何组织信息。

因此我逐渐搭建出了一套围绕自己工作的 Personal AI Stack。

工作流视角
这不是一个单点工具,不是一个模型。它强调的是“思考、记忆、执行、发布”四个层级的持续协同。

整体架构

下面这个架构图展示了我的 Personal AI Stack 如何分层协同。

图 2: Personal AI Stack 架构层次
图 2: Personal AI Stack 架构层次

不同层级对应的核心组件如下。

组件
Interface LayerChatGPT、Telegram、Discord、飞书、微信
Reasoning LayerChatGPT、GLM-5.1、Claude Code、Codex
Memory LayerObsidian、Markdown、iCloud
Execution LayerOpenClaw、Gmail、Calendar、Lark CLI
Publishing LayerGitHub、Hugo、Cloudflare Pages
表 1: Personal AI Stack 层级与组件

ChatGPT:我的思考系统

虽然很多工作流围绕 Agent 展开,但我使用频率最高的其实是 ChatGPT。

我主要用它:

  • Deep Research
  • 技术分析
  • 架构讨论
  • 内容策划
  • 写作辅助
  • 职业决策

与其说它是助手,不如说它更像:

  • Research Partner
  • Technical Advisor
  • Thinking Companion

过去几年持续积累的大量对话,让它逐渐理解了我的背景、项目和长期目标。

很多文章、演讲和技术判断,实际上都来自这种持续对话。

OpenClaw:我的执行系统

OpenClaw 是我部署在家里 Mac mini M4 上的 OpenClaw Agent。

平时主要通过 Telegram 与 OpenClaw 交互。

为了避免上下文混杂,我专门使用不同 Telegram 群组管理不同主题:

  • HAMi
  • AI Handbook
  • Personal
  • Work
  • Research
  • Blog

这样天然形成了 Context Isolation。

OpenClaw 负责:

  • Gmail 邮件管理
  • Apple Calendar 日程管理
  • 定时任务
  • Obsidian 操作
  • GitHub 操作
  • 网站维护
  • 飞书知识库操作
  • 自动化工作流

它更像一个 Chief of Staff,而不是聊天机器人。

OpenClaw 定位
OpenClaw 的价值在于把分散的执行入口统一成结构化的工作流,而不是简单的聊天界面。

OpenClaw 的工作流

OpenClaw 的主要路径是通过 Telegram 入口展开多端执行。

图 3: OpenClaw 执行路径
图 3: OpenClaw 执行路径

飞书:公司工作流入口

我以前几乎没有使用过飞书。

加入现在的公司之后,公司整体提倡使用飞书,日常工作流、知识库、协作沟通都在飞书里进行。

刚开始我只是把它当成一个企业 IM 工具。

但现在看,飞书更像是公司级的工作流入口:

  • 群聊
  • 文档
  • 知识库
  • 审批
  • 任务
  • 自动化

对我来说,真正改变使用体验的是 Lark CLI。

通过 Lark CLI,我可以更方便地管理公司的知识库、文档和一些流程化信息。

这让飞书不只是一个聊天工具,而是可以被 OpenClaw 纳入自动化系统的一部分。

从个人 AI Stack 的角度看,飞书承担的是:

工作组织层。

它连接的是公司语境下的信息、知识和任务。

Obsidian:工作记忆(Working Memory)

Obsidian 是我最常用的知识工具。

但我并不把它视为最终知识库。

对于我来说:

Obsidian
=
工作记忆

这里存放:

  • Daily Notes
  • Weekly Reports
  • Research Notes
  • Inbox
  • Drafts
  • 临时想法

三年前开始,我养成了持续写周报的习惯。

这些周报记录了:

  • 工作进展
  • 学习内容
  • 社区活动
  • 项目演进
  • 个人思考

从某种意义上说,周报构成了我的日常记忆。

而 Obsidian 则是这些记忆的载体。

GitHub 与 jimmysong.io:长期记忆(Long-term Memory)

很多人会把博客理解为内容发布平台。

但对于我来说,jimmysong.io 更接近于我的长期记忆系统。

这个网站已经持续维护接近十年。

这里记录的不只是技术文章,更重要的是:

  • 我的观点
  • 我的判断
  • 我的经验
  • 我的成长轨迹

与 Obsidian 不同,能够进入网站的内容,通常都经过:

研究
思考
验证
写作
修改
发布

因此:

Obsidian
=
工作记忆

jimmysong.io
=
长期记忆

下面这个流程展示了从 Obsidian 到网站发布的基本路径。

图 4: 长期记忆发布流程
图 4: 长期记忆发布流程

信息流

内容的来源、整理方式和输出渠道之间有清晰的边界,这张图揭示了我的信息流逻辑。

图 5: Personal AI Stack 信息流
图 5: Personal AI Stack 信息流

GitHub:执行与发布层

GitHub 对我来说已经不仅仅是代码仓库。

它同时承担:

  • 博客内容
  • 网站源码
  • 文档系统
  • AI Handbook
  • AI Native Landscape

所有内容最终都会进入 GitHub。

GitHub Actions 自动完成:

  • 构建
  • 测试
  • 发布

最后通过 Cloudflare Pages 提供服务。

下面这张图展示了从 Markdown 到静态站的发布路径。

图 6: GitHub 发布管道
图 6: GitHub 发布管道

我的开发工具链

目前主要使用三套 AI 开发工具。

Claude Code

我的日常开发主力。

虽然名字叫 Claude Code,但目前主要使用智谱 GLM-5.1。

负责:

  • 编码
  • 重构
  • 调试
  • 文档维护

Codex

主要用于:

  • 初始化项目
  • 大规模代码生成
  • 自动执行复杂任务

OpenClaw

负责开发之外的自动化工作。

三者形成明确分工。

下面这张图展示了我的工具链协作方式。

图 7: 开发工具链协作
图 7: 开发工具链协作

为什么不用 Claude?

这是我被问得最多的问题之一。

客观来说,Claude 在代码生成和代码理解方面确实非常强。

我也认真考虑过使用 Claude 作为主力模型。

但最终没有采用。

原因并不是模型能力,而是整体投入产出比。

首先是账号问题。

过去我多次注册 Claude 账号,都遇到过限制和封禁问题。

其次是成本问题。

因为我的所有 AI 工具都是自己付费。

所以我更关注:

能力 / 成本

而不是:

绝对能力

对于企业用户来说,Claude Max 可能是非常合理的选择。

但对于个人付费用户而言,结论可能不同。

这篇文章讨论的,是完全由我个人支付的 Personal AI Stack。

如果公司报销,或者拥有企业预算,那么很多选择都会发生变化。

为什么不自己部署大模型?

这是另一个高频问题。

很多人认为:

买一张显卡 + 开源模型 = 免费 AI

实际上往往并不是这样。

如果只是为了获得一个稳定、强大的 AI 助手,我更倾向:

订阅 > 自建

原因包括:

时间成本

维护模型本身就是工作。

包括:

  • CUDA
  • 驱动
  • 推理框架
  • 模型升级
  • 网络问题

这些都需要时间。

而我希望把时间花在:

  • 写作
  • 社区
  • 产品
  • 技术研究

成本问题

目前:

  • ChatGPT Plus
  • GLM Coding Plan Max

每月总成本不到 600 元。

而一张高端 GPU:

  • RTX 5090D
  • RTX PRO
  • 企业 GPU

通常需要数万元。

再加上:

  • 电费
  • 折旧
  • 维护

对于我的场景来说并不划算。

模型升级速度

云端模型每个月都在升级。

而本地模型需要自己跟进。

对于知识工作者来说:

使用最新模型比拥有模型更重要。

订阅与自建
对于个人使用者,订阅服务通常在时间成本、升级速度和稳定性上更具优势。它让你把精力集中在结果,而不是基础设施维护。

日常工具

除了前面介绍的核心系统之外,我还依赖一些日常工具来完善整个工作流。

  • Atlas Browser:目前的主力浏览器,用于网页阅读、研究和信息收集,优秀内容会通过 Obsidian Clipper 保存到知识库。
  • Warp:我最常使用的终端工具,现代化的交互体验和 AI 能力让命令行工作更加高效。
  • Typora:长期使用的 Markdown 编辑器,适合沉浸式写作和长文编辑,很多博客和文档都在这里完成。
  • CodexBar:用于监控 ChatGPT、Codex、Claude Code 等工具的使用情况。对于重度 AI 用户来说,Token 消耗已经成为一种需要关注的资源指标。
  • 搜狗输入法:我目前主要使用的语音输入工具。相比键盘输入,语音更符合我的思考习惯,尤其是在远程办公、写作和与 AI 交流时效率更高。

这些工具本身并不是系统的核心,但它们构成了整个 Personal AI Stack 的基础体验层,让信息获取、内容创作和日常开发更加顺畅。

我的 AI 使用规模

目前大致消耗:

GLM-5.1

每周:

  • 6 亿 Token

每月:

  • 24 亿 Token

Codex

每周:

  • 2 亿 Token

每月:

  • 8 亿 Token

合计:

每月约 32 亿 Token

大概每天消耗 1 亿 Token。通过 ChatGPT Plus 和 GLM Coding Plan 订阅比起直接充值还是很划算的,不然这些 Token 每月至少要花 500 美元。

这套系统每个月花多少钱?

下面的表格对比了各项固定月度成本。

服务月费用
ChatGPT Plus$19.99
GLM Coding Plan Max¥422.1
iCloud+$0.99
表 2: 月度成本构成

约:

¥573 / 月

OpenClaw 运行在我的 Mac mini M4 上。

硬件包括:

  • Mac mini M4
  • Samsung 990 Pro 1TB
  • HAGIBIS 扩展坞

总投入约:

¥4469

按四年折旧:

约 100 元 / 月

总成本

整个 Personal AI Stack 固定成本约:

700 元人民币 / 月

这张成本饼图展示了 Personal AI Stack 的月度支出结构。

图 8: Personal AI Stack 月度成本估算
图 8: Personal AI Stack 月度成本估算

FAQ

这是不是最强配置?

不是。

这不是“最强 AI 工具配置指南”。

这是一个完全自费、面向个人长期使用的 Personal AI Stack。

如果公司报销,或者你有更高预算,可以选择 Claude Max、Cursor、更多 API 服务,甚至本地 GPU 工作站。

但我的目标不是追求绝对最强,而是在个人预算内获得稳定、可持续、可积累的生产力。

为什么不全量同步 ChatGPT 对话到 Obsidian?

因为我不想把 Obsidian 变成聊天记录仓库。

我更关心:

哪些内容值得长期保存?

手动保存本身就是一次筛选。

这比自动同步全部内容更重要。

为什么不用 Notion?

不是因为 Notion 不好。

而是因为我更偏向 Markdown First。

Markdown 的好处是:

  • 本地优先
  • 可版本管理
  • 可迁移
  • AI 友好
  • 适合长期保存

为什么 Telegram 只用来对接 OpenClaw?

因为 Telegram 的 Bot 生态和 API 更适合做 Agent 入口。

而微信、飞书、Discord 对我来说更多是人与人之间的沟通和社区协作工具。

为什么强调飞书?

因为加入现在的公司后,我才真正开始使用飞书。

公司整体工作流都围绕飞书展开。

对我来说,飞书不是个人知识库,而是公司知识和协作系统。

通过 Lark CLI,它可以进一步变成 OpenClaw 能够操作的工作流入口。

为什么不用本地 AI 工作站?

因为我的主要工作不是训练模型,也不是运营推理服务。

我的主要工作是:

  • 思考
  • 研究
  • 写作
  • 开源社区
  • 软件开发

订阅模型 + Mac mini 已经足够。

本地 AI 工作站投入大、维护复杂,而且模型升级速度未必跟得上云端服务。

为什么不买高端 NVIDIA GPU?

如果主要目的是学习 CUDA、GPU 调度、AI Infra,购买 GPU 有价值。

但如果主要目的是日常生产力,那么高端 GPU 并不一定划算。

对于我来说:

订阅模型比拥有 GPU 更重要。

工作流比模型更重要

过去一年最大的体会是:

很多人认为 AI 的核心是模型。

但我的体验恰恰相反。

真正影响生产力的往往不是模型排行榜,而是工作流设计。

一个 95 分的模型放在优秀工作流里,通常比一个 100 分的模型放在混乱工作流里更有价值。

从某种意义上说,这和云原生世界的发展过程非常相似。

GPU 很重要,但调度系统同样重要。

模型很重要,但工作流同样重要。

Agent 很重要,但长期记忆和执行系统同样重要。

对于我来说,Personal AI Stack 的最终目标并不是替代人。

而是把思考、记忆和执行连接起来,让更多时间留给真正重要的事情。

总结

这篇文章把我的 Personal AI Stack 定义为长期可运行的基础设施,而不是单一工具或单一模型。

核心结论是:在个人付费场景下,稳定的工作流、持续的记忆系统和可执行的自动化,比追求最强模型更能提升生产力。

如果你的目标是长期累计价值,那么把时间放在“协同方式”上,往往比把时间放在“模型排名”上更有回报。

宋净超(Jimmy Song)

宋净超(Jimmy Song)

专注于 AI 原生基础设施与云原生应用架构的研究与开源实践。

文章导航

评论区