Claude Code 源码看 Agent 架构之争
2026/4/2大约 4 分钟
核心结论
- Cloud Code 是当前最成功的 Agent 产品,完全不依赖任何第三方框架(LangChain、LangGraph、ReAct 均未使用)。
- 真正护城河:Claude 模型 × Cloud Code 深度协同优化。
- 架构哲学:模型负责智能,代码只做工程执行,核心循环极简,工程细节极重。

主流 Agent 框架对比
1. LangChain
- 定位:链式管道库,将提示词、模型、解析器、工具串成链。
- 优点:生态极强,集成 100+ 模型厂商。
- 致命问题:
- 抽象过重,胶水代码多
- 调用链路深,Debug 极难
- 生产团队反馈:只增加复杂度,无实质收益
- 官方自白(CEO):现有 Agent 抽象不够可靠、不可控,甚至永远不够好。
2. LangGraph
- 定位:LangChain 团队出品,有向图工作流,状态为一等公民。
- 优点:
- 支持 checkpoint、持久化、中断、人工介入
- 生产级案例最多(LinkedIn、Uber 等)
- 错误恢复能力最强:失败可路由到降级子图
- 缺点:学习曲线陡,配置重,简单任务“大炮打蚊子”,延迟偏高。
3. ReAct
- 本质:架构模式,不是框架:Think → Act → Observe。
- 致命缺陷:
- 依赖文本解析(正则抠 thought/action)
- 格式一变就崩,可靠性差
Cloud Code 架构核心设计
1. 为什么不用框架?
Anthropic 官方观点:
- 最成功的实现 = 简单可组合模式,而非复杂框架。
- 推荐直接用 LLM API,很多模式几行代码可实现。
2. 与 ReAct 的本质区别
- ReAct:模型输出自然文字 → 框架正则解析 → 易崩。
- Cloud Code:
- 用 Claude API 原生结构化返回(thinking / text / tool_use 分离)
- 无需任何文本解析,从根源杜绝解析失败。
- 你看到的“思考过程”:是 Claude API 的
extended thinking,不是 ReAct 步骤。
3. 核心循环(极简)
while True:
发消息给 Claude API
看 stop_reason
if tool_use:
执行工具 → 追加结果 → 继续循环- 概念上 20 行伪代码 即可描述。
4. 51 万行代码去哪了?
核心循环很简单,代码都在工程可靠性:
- 流式事件处理
- 90s 空闲看门狗
- 非流式降级、缓存击穿检测
- 35+ 功能模块按需叠加(扁平循环架构)
- 规划、上下文压缩、权限、后台任务、多 Agent 协作等
5. 关键设计亮点
- Todo 假工具:
- 无实际操作,仅让 Agent 写出计划并留在历史
- 工程化注意力,属于上下文策略。
- 六层防御管线(工具调用稳定性):
- Schema 校验
- 输入校验
- pre-tools 钩子
- 权限规则
- 实际执行
- post-tools 钩子(审计)
6. 记忆机制
- 短期记忆:耦合在循环内,三级压缩,维持 ~33k token 缓冲区。
- 长期记忆:解耦为独立文件系统。
- AutoDream:
- 后台子 Agent 做记忆整合
- 用提示词驱动,而非硬编码逻辑
- 触发条件:24h 未整合 + 积累 5+ 会话
7. 模型锁定与兼容性
- 原生只支持 Claude,但可通过环境变量代理转发到其他模型。
- 策略:放弃通用性,换单模型极致深度优化。
MCP:Agent 世界的“USB 协议”
- 全称:Model Context Protocol
- 定位:AI Agent 的通用连接协议,统一工具调用层。
- 价值:
- 把 M×N 集成问题 → M+N
- 框架只需对接 MCP,工具一次实现全框架可用
- 地位:已捐给 Linux 基金会,OpenAI、Anthropic 等均为成员,事实标准。
- 结论:不支持 MCP 的框架,商业上不可持续。
2026 最佳实践:混合架构
- LangGraph 做顶层骨架:
- 负责工作流、分支、checkpoint、错误恢复
- Cloud SDK / 裸 API 做节点执行:
- 负责实际推理、工具调用、深度协同
- 关系:互补,而非替代。
总结
- Cloud Code:架构极简,工程极重,模型优先。
- 框架之争终局:核心变薄,协议统一,生态为王。
- 做 Agent 不要迷信框架:直接调用 API + 可靠工程化,反而更稳更强。