Claude Code 源码看 Agent 架构之争

Yd Wen2026/4/2大约 4 分钟

核心结论

Cloud Code 是当前最成功的 Agent 产品，完全不依赖任何第三方框架（LangChain、LangGraph、ReAct 均未使用）。
真正护城河：Claude 模型 × Cloud Code 深度协同优化。
架构哲学：模型负责智能，代码只做工程执行，核心循环极简，工程细节极重。

思维导图

主流 Agent 框架对比

1. LangChain

定位：链式管道库，将提示词、模型、解析器、工具串成链。
优点：生态极强，集成 100+ 模型厂商。
致命问题：
- 抽象过重，胶水代码多
- 调用链路深，Debug 极难
- 生产团队反馈：只增加复杂度，无实质收益
官方自白（CEO）：现有 Agent 抽象不够可靠、不可控，甚至永远不够好。

2. LangGraph

定位：LangChain 团队出品，有向图工作流，状态为一等公民。
优点：
- 支持 checkpoint、持久化、中断、人工介入
- 生产级案例最多（LinkedIn、Uber 等）
- 错误恢复能力最强：失败可路由到降级子图
缺点：学习曲线陡，配置重，简单任务“大炮打蚊子”，延迟偏高。

3. ReAct

本质：架构模式，不是框架：Think → Act → Observe。
致命缺陷：
- 依赖文本解析（正则抠 thought/action）
- 格式一变就崩，可靠性差

Cloud Code 架构核心设计

1. 为什么不用框架？

Anthropic 官方观点：

最成功的实现 = 简单可组合模式，而非复杂框架。
推荐直接用 LLM API，很多模式几行代码可实现。

2. 与 ReAct 的本质区别

ReAct：模型输出自然文字 → 框架正则解析 → 易崩。
Cloud Code：
- 用 Claude API 原生结构化返回（thinking / text / tool_use 分离）
- 无需任何文本解析，从根源杜绝解析失败。
你看到的“思考过程”：是 Claude API 的 extended thinking，不是 ReAct 步骤。

3. 核心循环（极简）

while True:
    发消息给 Claude API
    看 stop_reason
    if tool_use:
        执行工具 → 追加结果 → 继续循环

概念上 20 行伪代码 即可描述。

4. 51 万行代码去哪了？

核心循环很简单，代码都在工程可靠性：

流式事件处理
90s 空闲看门狗
非流式降级、缓存击穿检测
35+ 功能模块按需叠加（扁平循环架构）
规划、上下文压缩、权限、后台任务、多 Agent 协作等

5. 关键设计亮点

Todo 假工具：
- 无实际操作，仅让 Agent 写出计划并留在历史
- 工程化注意力，属于上下文策略。
六层防御管线（工具调用稳定性）：
1. Schema 校验
2. 输入校验
3. pre-tools 钩子
4. 权限规则
5. 实际执行
6. post-tools 钩子（审计）

6. 记忆机制

短期记忆：耦合在循环内，三级压缩，维持 ~33k token 缓冲区。
长期记忆：解耦为独立文件系统。
AutoDream：
- 后台子 Agent 做记忆整合
- 用提示词驱动，而非硬编码逻辑
- 触发条件：24h 未整合 + 积累 5+ 会话

7. 模型锁定与兼容性

原生只支持 Claude，但可通过环境变量代理转发到其他模型。
策略：放弃通用性，换单模型极致深度优化。

MCP：Agent 世界的“USB 协议”

全称：Model Context Protocol
定位：AI Agent 的通用连接协议，统一工具调用层。
价值：
- 把 M×N 集成问题 → M+N
- 框架只需对接 MCP，工具一次实现全框架可用
地位：已捐给 Linux 基金会，OpenAI、Anthropic 等均为成员，事实标准。
结论：不支持 MCP 的框架，商业上不可持续。

2026 最佳实践：混合架构

LangGraph 做顶层骨架：
- 负责工作流、分支、checkpoint、错误恢复
Cloud SDK / 裸 API 做节点执行：
- 负责实际推理、工具调用、深度协同
关系：互补，而非替代。

总结

Cloud Code：架构极简，工程极重，模型优先。
框架之争终局：核心变薄，协议统一，生态为王。
做 Agent 不要迷信框架：直接调用 API + 可靠工程化，反而更稳更强。

参考资料

Claude Code 源码看 Agent 架构之争