Kimi K2 Thinking:国产思维型大模型的真正觉醒
Kimi K2 Thinking 的开源标志着国产模型进入思维型大模型时代。本文拆解其技术路线、核心理念、MoE 专家分工、工具链交织推理路径,并分析其与国际前沿 Claude/Gemini 的路线关系。
Kimi K2 Thinking:国产思维型大模型的真正觉醒
Kimi K2 Thinking 的开源标志着国产模型进入思维型大模型时代。本文拆解其技术路线、核心理念、MoE 专家分工、工具链交织推理路径,并分析其与国际前沿 Claude/Gemini 的路线关系。
使用云原生大模型开源四件套构建高效推理体系:KServe + vLLM + llm-d + WG Serving
云原生与 AI 原生架构师必读:KServe、vLLM、llm-d、WG Serving 如何形成大模型推理的云原生“四件套”,各自定位与组合优势,以及生态融合趋势分析。
Istio 1.28 深入解析:通过 InferencePool、Ambient Multicluster、nftables 与 Dual‑stack,提升 LLM 推理基础设施的可观测性、可靠性与高并发网络性能。
从 Kubernetes 到 Qwen:AI 时代的“开源”为何变了?
探讨 AI 时代开源的变革,从 Kubernetes 到 Qwen,揭示中美厂商在开源策略上的根本差异与新机遇。
以《红楼梦》作者与脂砚斋批注的协作为例,类比现代大语言模型与提示工程师的互动,探讨人机协作与反馈循环对创作和 AI 训练的启示。
本文介绍我最近使用 AI 翻译的新书《AI 原生软件交付》,分享书中的核心观点与个人感受。
探索 AnythingLLM:借助开源 AI 打造私有化智能知识库
探索如何使用开源项目 AnythingLLM 构建私有化智能知识库。通过 RAG 技术,将文档转化为可检索向量,结合大语言模型实现高效问答,适用于企业与个人开发者。
译给初学生成式 AI(GenAI)的开发人员的 7 条最佳实践
这篇文章分享了七个步骤,帮助开发者掌握生成式 AI 的基本概念和技能。