个人 AI 基础设施不是单一工具,而是长期协同的系统。

很多人在讨论 AI Agent、第二大脑(Second Brain)、个人知识管理(PKM)和数字分身。
但过去一年,我逐渐意识到,我真正构建的并不是某个 AI 助手,而是一套持续运行的个人 AI 基础设施(Personal AI Infrastructure)。
它不是某个产品,也不是某个模型,而是一组长期协同工作的系统。
这套系统每天帮助我思考、研究、写作、开发、管理知识、处理邮件、维护网站,并持续积累长期记忆。
如果用一句话概括:
ChatGPT 负责思考,OpenClaw 负责执行,Obsidian 负责记忆,GitHub 负责发布。
从工具到基础设施
大部分 AI 工作流文章的结构都差不多,先讲模型、插件、编辑器。
但我越来越觉得,工具不是重点。
重点是这些工具如何协同工作。
我的工作横跨:
- AI 基础设施研究
- 开源社区运营
- 技术写作
- Developer Relations
- 产品与生态建设
每天都会产生大量信息:
- ChatGPT 对话
- 技术研究
- GitHub 活动
- 社区讨论
- 邮件订阅
- Hacker News
- Discord
- 微信和飞书消息
问题从来不是缺少信息,而是如何组织信息。
因此我逐渐搭建出了一套围绕自己工作的 Personal AI Stack。
整体架构
下面这个架构图展示了我的 Personal AI Stack 如何分层协同。
不同层级对应的核心组件如下。
| 层 | 组件 |
|---|---|
| Interface Layer | ChatGPT、Telegram、Discord、飞书、微信 |
| Reasoning Layer | ChatGPT、GLM-5.1、Claude Code、Codex |
| Memory Layer | Obsidian、Markdown、iCloud |
| Execution Layer | OpenClaw、Gmail、Calendar、Lark CLI |
| Publishing Layer | GitHub、Hugo、Cloudflare Pages |
ChatGPT:我的思考系统
虽然很多工作流围绕 Agent 展开,但我使用频率最高的其实是 ChatGPT。
我主要用它:
- Deep Research
- 技术分析
- 架构讨论
- 内容策划
- 写作辅助
- 职业决策
与其说它是助手,不如说它更像:
- Research Partner
- Technical Advisor
- Thinking Companion
过去几年持续积累的大量对话,让它逐渐理解了我的背景、项目和长期目标。
很多文章、演讲和技术判断,实际上都来自这种持续对话。
OpenClaw:我的执行系统
OpenClaw 是我部署在家里 Mac mini M4 上的 OpenClaw Agent。
平时主要通过 Telegram 与 OpenClaw 交互。
为了避免上下文混杂,我专门使用不同 Telegram 群组管理不同主题:
- HAMi
- AI Handbook
- Personal
- Work
- Research
- Blog
这样天然形成了 Context Isolation。
OpenClaw 负责:
- Gmail 邮件管理
- Apple Calendar 日程管理
- 定时任务
- Obsidian 操作
- GitHub 操作
- 网站维护
- 飞书知识库操作
- 自动化工作流
它更像一个 Chief of Staff,而不是聊天机器人。
OpenClaw 的工作流
OpenClaw 的主要路径是通过 Telegram 入口展开多端执行。
飞书:公司工作流入口
我以前几乎没有使用过飞书。
加入现在的公司之后,公司整体提倡使用飞书,日常工作流、知识库、协作沟通都在飞书里进行。
刚开始我只是把它当成一个企业 IM 工具。
但现在看,飞书更像是公司级的工作流入口:
- 群聊
- 文档
- 知识库
- 审批
- 任务
- 自动化
对我来说,真正改变使用体验的是 Lark CLI。
通过 Lark CLI,我可以更方便地管理公司的知识库、文档和一些流程化信息。
这让飞书不只是一个聊天工具,而是可以被 OpenClaw 纳入自动化系统的一部分。
从个人 AI Stack 的角度看,飞书承担的是:
工作组织层。
它连接的是公司语境下的信息、知识和任务。
Obsidian:工作记忆(Working Memory)
Obsidian 是我最常用的知识工具。
但我并不把它视为最终知识库。
对于我来说:
Obsidian
=
工作记忆这里存放:
- Daily Notes
- Weekly Reports
- Research Notes
- Inbox
- Drafts
- 临时想法
三年前开始,我养成了持续写周报的习惯。
这些周报记录了:
- 工作进展
- 学习内容
- 社区活动
- 项目演进
- 个人思考
从某种意义上说,周报构成了我的日常记忆。
而 Obsidian 则是这些记忆的载体。
GitHub 与 jimmysong.io:长期记忆(Long-term Memory)
很多人会把博客理解为内容发布平台。
但对于我来说,jimmysong.io 更接近于我的长期记忆系统。
这个网站已经持续维护接近十年。
这里记录的不只是技术文章,更重要的是:
- 我的观点
- 我的判断
- 我的经验
- 我的成长轨迹
与 Obsidian 不同,能够进入网站的内容,通常都经过:
研究
↓
思考
↓
验证
↓
写作
↓
修改
↓
发布因此:
Obsidian
=
工作记忆
jimmysong.io
=
长期记忆下面这个流程展示了从 Obsidian 到网站发布的基本路径。
信息流
内容的来源、整理方式和输出渠道之间有清晰的边界,这张图揭示了我的信息流逻辑。
GitHub:执行与发布层
GitHub 对我来说已经不仅仅是代码仓库。
它同时承担:
- 博客内容
- 网站源码
- 文档系统
- AI Handbook
- AI Native Landscape
所有内容最终都会进入 GitHub。
GitHub Actions 自动完成:
- 构建
- 测试
- 发布
最后通过 Cloudflare Pages 提供服务。
下面这张图展示了从 Markdown 到静态站的发布路径。
我的开发工具链
目前主要使用三套 AI 开发工具。
Claude Code
我的日常开发主力。
虽然名字叫 Claude Code,但目前主要使用智谱 GLM-5.1。
负责:
- 编码
- 重构
- 调试
- 文档维护
Codex
主要用于:
- 初始化项目
- 大规模代码生成
- 自动执行复杂任务
OpenClaw
负责开发之外的自动化工作。
三者形成明确分工。
下面这张图展示了我的工具链协作方式。
为什么不用 Claude?
这是我被问得最多的问题之一。
客观来说,Claude 在代码生成和代码理解方面确实非常强。
我也认真考虑过使用 Claude 作为主力模型。
但最终没有采用。
原因并不是模型能力,而是整体投入产出比。
首先是账号问题。
过去我多次注册 Claude 账号,都遇到过限制和封禁问题。
其次是成本问题。
因为我的所有 AI 工具都是自己付费。
所以我更关注:
能力 / 成本
而不是:
绝对能力
对于企业用户来说,Claude Max 可能是非常合理的选择。
但对于个人付费用户而言,结论可能不同。
这篇文章讨论的,是完全由我个人支付的 Personal AI Stack。
如果公司报销,或者拥有企业预算,那么很多选择都会发生变化。
为什么不自己部署大模型?
这是另一个高频问题。
很多人认为:
买一张显卡 + 开源模型 = 免费 AI
实际上往往并不是这样。
如果只是为了获得一个稳定、强大的 AI 助手,我更倾向:
订阅 > 自建
原因包括:
时间成本
维护模型本身就是工作。
包括:
- CUDA
- 驱动
- 推理框架
- 模型升级
- 网络问题
这些都需要时间。
而我希望把时间花在:
- 写作
- 社区
- 产品
- 技术研究
成本问题
目前:
- ChatGPT Plus
- GLM Coding Plan Max
每月总成本不到 600 元。
而一张高端 GPU:
- RTX 5090D
- RTX PRO
- 企业 GPU
通常需要数万元。
再加上:
- 电费
- 折旧
- 维护
对于我的场景来说并不划算。
模型升级速度
云端模型每个月都在升级。
而本地模型需要自己跟进。
对于知识工作者来说:
使用最新模型比拥有模型更重要。
日常工具
除了前面介绍的核心系统之外,我还依赖一些日常工具来完善整个工作流。
- Atlas Browser:目前的主力浏览器,用于网页阅读、研究和信息收集,优秀内容会通过 Obsidian Clipper 保存到知识库。
- Warp:我最常使用的终端工具,现代化的交互体验和 AI 能力让命令行工作更加高效。
- Typora:长期使用的 Markdown 编辑器,适合沉浸式写作和长文编辑,很多博客和文档都在这里完成。
- CodexBar:用于监控 ChatGPT、Codex、Claude Code 等工具的使用情况。对于重度 AI 用户来说,Token 消耗已经成为一种需要关注的资源指标。
- 搜狗输入法:我目前主要使用的语音输入工具。相比键盘输入,语音更符合我的思考习惯,尤其是在远程办公、写作和与 AI 交流时效率更高。
这些工具本身并不是系统的核心,但它们构成了整个 Personal AI Stack 的基础体验层,让信息获取、内容创作和日常开发更加顺畅。
我的 AI 使用规模
目前大致消耗:
GLM-5.1
每周:
- 6 亿 Token
每月:
- 24 亿 Token
Codex
每周:
- 2 亿 Token
每月:
- 8 亿 Token
合计:
每月约 32 亿 Token
大概每天消耗 1 亿 Token。通过 ChatGPT Plus 和 GLM Coding Plan 订阅比起直接充值还是很划算的,不然这些 Token 每月至少要花 500 美元。
这套系统每个月花多少钱?
下面的表格对比了各项固定月度成本。
| 服务 | 月费用 |
|---|---|
| ChatGPT Plus | $19.99 |
| GLM Coding Plan Max | ¥422.1 |
| iCloud+ | $0.99 |
约:
¥573 / 月
OpenClaw 运行在我的 Mac mini M4 上。
硬件包括:
- Mac mini M4
- Samsung 990 Pro 1TB
- HAGIBIS 扩展坞
总投入约:
¥4469
按四年折旧:
约 100 元 / 月
总成本
整个 Personal AI Stack 固定成本约:
700 元人民币 / 月
这张成本饼图展示了 Personal AI Stack 的月度支出结构。
FAQ
这是不是最强配置?
不是。
这不是“最强 AI 工具配置指南”。
这是一个完全自费、面向个人长期使用的 Personal AI Stack。
如果公司报销,或者你有更高预算,可以选择 Claude Max、Cursor、更多 API 服务,甚至本地 GPU 工作站。
但我的目标不是追求绝对最强,而是在个人预算内获得稳定、可持续、可积累的生产力。
为什么不全量同步 ChatGPT 对话到 Obsidian?
因为我不想把 Obsidian 变成聊天记录仓库。
我更关心:
哪些内容值得长期保存?
手动保存本身就是一次筛选。
这比自动同步全部内容更重要。
为什么不用 Notion?
不是因为 Notion 不好。
而是因为我更偏向 Markdown First。
Markdown 的好处是:
- 本地优先
- 可版本管理
- 可迁移
- AI 友好
- 适合长期保存
为什么 Telegram 只用来对接 OpenClaw?
因为 Telegram 的 Bot 生态和 API 更适合做 Agent 入口。
而微信、飞书、Discord 对我来说更多是人与人之间的沟通和社区协作工具。
为什么强调飞书?
因为加入现在的公司后,我才真正开始使用飞书。
公司整体工作流都围绕飞书展开。
对我来说,飞书不是个人知识库,而是公司知识和协作系统。
通过 Lark CLI,它可以进一步变成 OpenClaw 能够操作的工作流入口。
为什么不用本地 AI 工作站?
因为我的主要工作不是训练模型,也不是运营推理服务。
我的主要工作是:
- 思考
- 研究
- 写作
- 开源社区
- 软件开发
订阅模型 + Mac mini 已经足够。
本地 AI 工作站投入大、维护复杂,而且模型升级速度未必跟得上云端服务。
为什么不买高端 NVIDIA GPU?
如果主要目的是学习 CUDA、GPU 调度、AI Infra,购买 GPU 有价值。
但如果主要目的是日常生产力,那么高端 GPU 并不一定划算。
对于我来说:
订阅模型比拥有 GPU 更重要。
工作流比模型更重要
过去一年最大的体会是:
很多人认为 AI 的核心是模型。
但我的体验恰恰相反。
真正影响生产力的往往不是模型排行榜,而是工作流设计。
一个 95 分的模型放在优秀工作流里,通常比一个 100 分的模型放在混乱工作流里更有价值。
从某种意义上说,这和云原生世界的发展过程非常相似。
GPU 很重要,但调度系统同样重要。
模型很重要,但工作流同样重要。
Agent 很重要,但长期记忆和执行系统同样重要。
对于我来说,Personal AI Stack 的最终目标并不是替代人。
而是把思考、记忆和执行连接起来,让更多时间留给真正重要的事情。
总结
这篇文章把我的 Personal AI Stack 定义为长期可运行的基础设施,而不是单一工具或单一模型。
核心结论是:在个人付费场景下,稳定的工作流、持续的记忆系统和可执行的自动化,比追求最强模型更能提升生产力。
如果你的目标是长期累计价值,那么把时间放在“协同方式”上,往往比把时间放在“模型排名”上更有回报。
