📖 AI 原生基础设施:从云原生到 AI 原生的架构演进指南

我使用的 Vibe Coding 大模型推荐

真实使用一个多月、累计近 4 亿 token 后,我目前的 Vibe Coding 大模型与工具链组合实践经验总结。

编程模型的选择没有绝对标准,关键是找到最适合自己工作流的那一套组合。

最近经常有人问我一个问题:

你现在日常编程,到底在用哪些大模型?

索性借这篇文章,把我最近一个多月真实在用的 Vibe Coding 组合系统梳理一下。这不是一篇测评,也不是排行榜,更不是那种“用一次就来写推荐”的广告文,而是我已经稳定使用了一段时间、而且还在持续高频调用的模型与工具组合

先说结论:我现在的主力模型组合

如果用一句话总结我现在的状态,大概是:

多模型并行 + 多工具入口 + 场景分工 + 顺手优先

目前我最常用的几类大语言模型(LLM)是:

  • 智谱 GLM 4.7(编程大模型) 👉 日常主力,调用频率最高
  • Claude Sonnet 4.5 👉 目前我个人觉得“手感最好”的编程模型
  • Codex 5.2(ChatGPT / Copilot / OpenAI 系) 👉 解决疑难杂症、复杂上下文问题
  • Gemini 3.0 Pro(偶尔使用) 👉 免费额度在那,不用白不用

这些模型对我来说不是“谁淘汰谁”的关系,而是在不同工具和不同场景下,各自发挥价值

为什么我会把 GLM 4.7 当作“日常主力”

我用智谱 GLM 4.7 已经接近一个月,累计 token 使用量接近 4 亿。这不是浅尝辄止,而是非常重度、非常日常的使用

而且有一个很重要的前提是:我不是只在一个工具里用它。

订阅福利
速来拼好模,智谱 GLM Coding 超值订阅,邀你一起薅羊毛!Claude Code、Cline 等 20+ 大编程工具无缝支持,“码力”全开,越拼越爽!立即开拼,享限时惊喜价! 订阅入口 - bigmodel.cn

下图展示了智谱官方的跨年优惠活动页面:

图 1: 智谱跨年优惠
图 1: 智谱跨年优惠

不只是 Open Code,用起来顺才是真的顺

在 Open Code 里,GLM 4.7 是我最常切换到的模型之一:

  • 反应速度快
  • 成本可控
  • 很适合高频打断、快速调整的 Vibe Coding 节奏

它非常适合那种“我先试一版 → 不满意 → 马上改 → 再细化”的工作流。

在 Cloud Code 里也很好用(这是关键)

另外一个让我持续使用 GLM 4.7 的原因是:它在 Cloud Code 里的体验也很好。

Cloud Code 本身是原生支持 Claude Code 的,而我经常:

  • 在 Claude Code 的环境里
  • 直接调用 GLM 4.7 来写代码、改代码、补逻辑

这点非常重要,因为这意味着:我并不需要为了用某个模型,去迁就某个工具。

GLM 4.7 能自然地融入我已经习惯的工具链,这是我持续用它的根本原因之一。

编程能力 + 成本,决定它能不能当“主力”

从纯编程体验来说,我的主观判断是:

GLM 4.7 至少在 Claude Sonnet 4.0 这一档

在 Web coding、脚手架、业务逻辑、快速原型这些高频场景里,它已经完全够用。

再加上成本压力明显更小,它就非常适合当那种“我可以放心多问几轮、多改几版”的主力模型。

下图为我个人 GLM 4.7 累计 token 使用量的截图:

图 2: 我已经使用了 4 亿 token 的智谱 GLM 4.7 模型
图 2: 我已经使用了 4 亿 token 的智谱 GLM 4.7 模型

其他模型:我为什么还在用,但不用它们当主力

Claude Sonnet 4.5:目前最“顺手”的编程体验

我不避讳地说一句:Sonnet 4.5 依然是我心目中编程体验最好的模型之一。

但它的问题也很现实:

  • 成本更高
  • 更适合用在关键节点,而不是全程高频消耗

所以我通常把它用在:

  • 架构级修改
  • 比较关键的代码生成
  • 需要一次到位的场景

Codex 5.2:专门解决“疑难杂症”

Codex 对我来说,更多是:

  • 看复杂上下文
  • 处理历史代码
  • 解决“别的模型反复跑偏”的问题

好用,但不适合当烧 token 的主力。

Gemini 3.0 Pro:偶尔“薅一下免费额度”

我有时也会用 Gemini 3.0 Pro,尤其是在 Antigravity 里的调用,或者直接调用 Sonnet 4.5 或 Gemini。

下图展示了 Antigravity 工具中 Gemini 3.0 Pro 的界面:

图 3: Antigravity 里的 Gemini 3.0 Pro
图 3: Antigravity 里的 Gemini 3.0 Pro

原因很简单:有免费额度,不用白不用。

这类使用更多是补充型,不会进入我的核心工作流,但确实能解决一些临时需求。

Vibe Coding 的“灵魂”:语音输入

如果你还没试过语音 + 编程模型,那你对 Vibe Coding 的理解,可能还停留在 70%。

我目前最常用的:秒言(Mac)

我现在在 Mac 上主要用的是秒言

  • 识别准确
  • 延迟低
  • 非常适合边想边说、边说边改代码

下图为秒言语音输入法的界面截图:

图 4: 秒言语音输入法
图 4: 秒言语音输入法

虽然这家公司已经不在了,但我之前兑换过积分,目前还能继续用一段时间。

智谱 AI 语音输入法:性价比型选择

如果你已经订阅了智谱的编程套餐,那它的 AI 语音输入法是可以免费使用的。

客观说一句:

  • 体验还在进化中
  • 但胜在集成度高、额外成本为零

对已经在用 GLM 4.7 的人来说,这是一个完全合理的备选方案。

关于 GLM 4.7 的订阅这件事

这篇文章写到这里,你应该能看出来:我不是因为有优惠才开始用它,而是因为已经在用,所以顺便提一下优惠。

目前 GLM 4.7 的订阅正好处在优惠期,据我了解到这个月底结束,大概还剩一周左右。

如果你:

  • 本来就需要一个可长期使用的编程模型
  • 又不想在成本上太有心理负担

那这个时间点,其实还挺合适的。

文章里的链接和二维码,是我自己的订阅入口。是否使用,完全取决于你自己的判断。

最后一点个人感受

现在这种AI + 编程 + 语音的状态,对我来说已经有点像一种轻度娱乐。

有空的时候,我会随手做点 Vibe Coding:不一定上线、不一定交付,就是自己玩、自己爽、顺便学点新东西。

如果你已经在写代码,也已经在用大模型,我的建议只有一句:

不要执着于“哪个最强”,而是找到“在你工具链里最顺的那一个”。

对我来说,目前这套组合就是答案。

我的模型与工具实践补充

除了上面提到的主力模型和工具,我还经常在 VS Code 里用到 GPT-4.1GPT-5 mini。因为我订阅了 Copilot Pro,这两个模型在 VS Code 侧边栏和编辑器内都可以免费用。

我的常见用法包括:

  • 自定义提示词:比如让模型帮我优化文章结构、润色内容、自动排版,或者批量处理 Markdown。
  • 调用 MCP/工具链:结合 VS Code 的 MCP 工具,快速插入新资源、生成图表、批量处理内容。

这种集成体验极大提升了内容生产和开发效率,尤其适合需要频繁编辑、重构、批量处理的场景。

另外,我还会用 OpenAI 推出的 Atlas 浏览器。它可以在浏览器侧边栏直接与 ChatGPT 对话,支持:

  • 针对任意网页提问、总结、重写内容
  • 直接访问本地网站和页面,调试本地服务
  • 结合历史 Memory,跨网页追踪上下文
  • 让 ChatGPT 充当编辑、UI/UX 工程师,给出专业建议

Atlas 最大的优势是免费、无缝集成,尤其适合调试本地网页、快速获取内容建议、或作为多角色 AI 助手。

这两个工具的组合,让我在内容创作、开发和调试时都能获得高质量、免费的 AI 支持。

总结

Vibe Coding 并不是“哪个模型最强”或“哪个工具最全”的问题,而是如何把多模型、多入口、多场景的能力,组合成最适合自己习惯的开发体验。我的实践证明,找到顺手的模型和工具链,才是提升效率和乐趣的关键。

宋净超(Jimmy Song)

宋净超(Jimmy Song)

专注于 AI 原生基础设施与云原生应用架构的研究与开源生态建设。

文章导航