Skip to content
星际流动

我如何用 LLM 写软件:架构师+开发者+审查者的多 Agent 工作流

深度观点 7.8 分 — 实用的方法论分享,包含完整真实案例,对 LLM 编程工作流有深入思考
原文: Hacker News

评分 7.8 · 来源:Hacker News · 发布于 2026-03-16

评分依据:详细的实战方法论,包含完整的真实编程会话(为 Stavrobot 添加邮件支持),对多模型协作、架构决策、失败模式有深入思考,对 LLM 编程实践有很强的参考价值

要点

作者分享了用 LLM 编程的完整工作流,核心观点:喜欢的是做东西,编程只是手段之一。自从 LLM 擅长编程后,可以更快地做出高质量的东西。

工作流架构(三角色):

  1. 架构师(Claude Opus 4.6):唯一与人交互的 Agent,负责理解需求、讨论方案、做架构决策,输出低层级计划(文件和函数级别)
  2. 开发者(Sonnet 4.6):执行架构师的计划,实现具体代码
  3. 审查者(Codex 5.4 + Gemini 3 Flash + Opus 4.6):独立审查代码,提供反馈

关键原则:

失败模式:

当对技术栈不熟悉时,无法发现 LLM 的错误决策,导致代码越来越乱,最终无法收拾。解决方法:在规划阶段尽可能理解技术,引导 LLM 做正确的架构选择。

真实案例:为 Stavrobot 添加邮件支持

文章包含完整的编程会话记录(已标注),展示了:

整个功能从需求讨论到实现完成约 1 小时,代码可靠性高。

已构建的项目:

🤖 AI 点评

这篇文章的价值在于「诚实」——不是展示 LLM 有多神奇,而是展示如何在 LLM 的局限性下建立可靠的工作流。

多模型协作不是噱头,而是必需品。Opus 做架构决策、Sonnet 写代码、Codex 挑刺,这种分工利用了不同模型的性格差异(Codex 挑剔、Opus 决策合理、Gemini Flash 有时能看到其他模型看不到的解法)。

「架构阶段花 30 分钟」这个时间投入很关键。很多人用 LLM 编程失败是因为跳过了这一步,直接让 LLM 开始写代码,结果需求没对齐、架构没想清楚,后面越改越乱。

失败模式的坦诚也很重要:对技术栈不熟悉时,LLM 会做出看似合理但实际糟糕的决策,而你无法发现。这说明 LLM 编程不是「不需要懂技术」,而是「技能从写代码转移到架构和决策」。

完整的真实会话记录是这篇文章最大的亮点——不是精心挑选的成功案例,而是包含了遗漏、bug、重构、安全考虑的完整过程。这比任何方法论描述都更有说服力。


标签: