序言
软件行业正处于一个关键时刻。系统日益复杂,用户需求呈指数级增长,而无论是财务、声誉还是运营方面的失败成本都达到了前所未有的高度。然而,尽管经历了数十年的发展,许多团队仍然受制于过时的实践:手动部署、被动救火,以及因自身复杂性而崩溃的工具链。本书旨在弥合我们当前状态与未来目标之间的鸿沟。它是一份指引图,帮助您从脆弱、高风险的交付模式转向 AI 驱动的自主交付——一个软件能自我部署、系统能自我修复、创新速度超越风险的未来。
本书读者
本书为以下读者撰写:
- 寻求用智能自动化取代繁重劳动的工程师和 DevOps 实践者
- 负责将 DevOps 成熟度与业务成果(如速度、韧性和成本控制)对齐的技术领导者
- 希望了解 AI 原生交付如何加速价值实现的产品经理和创新者
- 任何关注软件未来的人,从 CTO 到学生,准备重新思考部署、测试和可观察性领域的一切可能性
本书创作缘由
作为受过专业训练的软件工程师,我们多年来一直致力于研究软件开发和交付的演进。然而,OpenAI 于 2022 年末推出 ChatGPT,对我们而言标志着一个转折点。与业界许多人一样,我们不仅将生成式 AI 视为一个编码助手,更将其视为重塑整个交付流水线的催化剂。
在接下来的三年里,我们对 AI(从代码生成到代理工作流)将如何重塑部署、测试和治理进行了假设、测试和验证。
我们撰写本书是因为软件交付的利害关系已经改变。微服务、云原生架构和 AI 生成代码的兴起,使得传统的 DevOps 1.0 实践变得力不从心。团队如今在一个流水线中要同时处理十余种工具,与“依赖地狱”作斗争,并面临类似 SolarWinds 式的供应链攻击威胁,同时还要努力满足消费者科技巨头所塑造的用户期望。
现有资源大多侧重于历史性的 DevOps 概念,或者抽象地推测 AI。本书旨在将这些点连接起来。基于 25 年来从敏捷的早期成功到 Kubernetes 编排革命的经验教训,我们将技术严谨性与前瞻性洞察相结合。现代工具印证了这种转变。我们展示了 AI 不仅在自动化任务,还在重塑协作、治理和创新。
当然,变化的步伐永不停歇。代理式 AI、自运营系统和新框架每月都在涌现。尽管我们力求本书能够适应未来,但我们也承认某些细节会随之演变。然而,核心原则不会改变:自动化繁重工作、优先考虑韧性,以及使交付与业务价值对齐。
本书导读
本书并非追逐潮流,而是旨在构建在复杂环境中蓬勃发展的系统。每一章都将理论与真实世界的案例相结合,从《凤凰项目》的 DevOps 寓言到 AI 驱动的部署。无论您是逐章阅读还是深入特定章节,读完本书后,您都将掌握改造交付流程和提升团队影响力所需的知识。
第一章,“AI 原生 DevOps 之路”追溯了软件交付从混乱的手动部署到 DevOps 1.0 实践(及其文化转变和自动化工具)的演变,同时强调了 DevOps 2.0 旨在通过 AI 原生能力和集成平台解决的当前挑战,例如微服务复杂性和工具链蔓延。
第二章,“源代码管理”追溯了源代码管理(SCM)从早期系统到 Git 当前主导地位的演变(截至 2022 年,近 95% 的开发者使用 Git),解释了现代 SCM 如何解决代码冲突和版本跟踪问题,同时提供了关于分支策略、GitOps、AI 集成以及您组织实施考虑的实用指导。
第三章,“持续集成的构建与部署前测试步骤”探讨了持续集成(CI)从其历史根源到现代 AI 增强实践的演变,详细阐述了构建自动化、智能缓存和策略性测试方法如何协同工作,以加速软件交付,同时在整个部署前流水线中保持质量和安全性。
第四章,“部署到测试环境”引导您完成 CI 与生产部署之间的关键阶段,探讨如何在不同环境间建立一致的部署流程,利用基础设施即代码(IaC)提升可靠性,实施 GitOps 工作流,优化测试策略(包括新兴的 AI 驱动方法),并自动化升级决策——所有这些都是为了在开发与实际使用之间建立无缝衔接,同时保持速度和稳定性。
第五章,“保护应用程序和软件供应链安全”审视了不断演进的软件供应链安全格局,详细阐述了组织如何通过左移实践、软件构件供应链级别(SLSA)框架、软件物料清单(SBOM)和 AI 增强型安全工具来保护其应用程序,同时培养一种将安全性整合到整个软件开发生命周期(SDLC)中的协作式 DevSecOps 文化。
第六章,“混沌工程与服务可靠性”探讨了混沌工程作为构建弹性系统的系统化方法,展示了如何将受控故障实验(从简单的延迟测试到复杂的基础设施扰动)与服务级别目标(SLOs)、错误预算以及持续集成和持续交付(CI/CD)流水线相结合,从而创建一种持续韧性的文化,将不可预测的故障转化为可预期、可管理的事件。
第七章,“部署到生产环境”通过一个真实案例研究的视角,深入探讨了生产部署的关键挑战,提供了一个涵盖现代部署治理、渐进式交付策略和 AI 增强验证技术的综合框架,这些技术共同将高风险部署转变为受控、可观察且可回滚的流程,从而保护您的应用程序和业务。
第八章,“特性管理与实验”阐述了特性管理和实验如何作为现代软件交付的基石,展示了特性标志如何实现主干开发、团队解耦和渐进式交付,同时 AI 增强型实验如何将产品决策从主观争论转变为数据驱动的洞察,从而最大化业务价值。
第九章,“AI 与自动化在云成本管理中的应用”审视了复杂的云成本管理世界,追溯其演变为 FinOps 实践的过程,审视了多云挑战,并展示了 AI 驱动的解决方案如何优化资源分配、强制执行治理策略,并将成本效率与业务目标和环境可持续性目标对齐。
第十章,“现代 DevOps 的平台工程方法”探讨了平台工程如何通过创建集成的、自助式平台来解决开发者认知负荷危机,这些平台提供“铺设好的道路”和标准化模板,使组织能够在平衡开发者生产力与治理要求的同时,将平台视为产品,将开发者视为其客户——所有这些都通过一个金融服务组织的实际案例进行了说明,该组织仅用 6 名平台工程师就服务了 1400 名开发者,从而变革了其交付能力。
O’Reilly 在线学习
40 多年来,O’Reilly Media 一直致力于提供技术和商业培训、知识和洞察,帮助企业取得成功。
我们独特的专家和创新者网络通过书籍、文章和在线学习平台分享他们的知识和专业经验。O’Reilly 的在线学习平台为您提供按需访问的直播培训课程、深入学习路径、交互式编码环境,以及来自 O’Reilly 和 200 多家其他出版商的海量文本和视频内容。欲了解更多信息,请访问 https://oreilly.com。
联系我们
关于本书的评论和问题,请联系出版商:
O’Reilly Media, Inc. 141 Stony Circle, Suite 195 Santa Rosa, CA 95401 800-889-8969 (美国或加拿大境内) 707-827-7019 (国际或本地) 707-829-0104 (传真) [email protected] https://oreilly.com/about/contact.html
我们为本书设有一个网页,其中列出了勘误、示例和任何补充信息。您可以在此页面访问:https://oreil.ly/ai-native-software-delivery。
获取有关我们书籍和课程的新闻与信息,请访问 https://oreilly.com。
在领英上关注我们:https://linkedin.com/company/oreilly-media。
在 YouTube 上观看我们:https://youtube.com/oreillymedia。
致谢
我们对许多个人深表感谢,他们的专业知识、鼓励和坚定不移的支持将本书从一个大胆的想法变成了现实。
特别感谢我们优秀的同事们提供了专业知识:Matthew Schillerstrom、David Karow、Mridhula Venkat、Dan Gordan、Sean Roth、Harold Bell 和 Patrick Wolf。
我们还要感谢本书的技术审阅者——Charles Humble、Julian Setiawan、Sagar Gandhi 和 Laura Uzcategui——对本书技术方面提供的宝贵反馈。
还要感谢 O’Reilly 团队在整个撰写过程中给予我们的支持:采购编辑 Louise Corrigan、开发编辑 Jeff Bleiel、制作编辑 Elizabeth Faerm 和执行编辑 Lisa LaRew。
也要感谢 Kristy Saunders。