OpenClaw + Codex/ClaudeCode Agent Swarm：一人开发团队实战指南

整理自 @elvissun 的深度实践分享

原文：Twitter/X

核心观点

作者不再直接使用 Codex 或 Claude Code，而是使用 OpenClaw 作为编排层。

他的编排器 “Zoe” 负责：

生成 Agent
编写 Prompt
为每个任务选择合适模型
监控进度
PR 就绪时通过 Telegram 通知

4周实战数据

指标	数据
单日最高提交	94 commits（平均 ~50 commits/天）
30分钟完成	7 PRs
成功率	小中型任务几乎无需干预即可一次完成
成本	~$100/月 Claude + $90/月 Codex（最低 $20 可起步）

为什么需要编排层？

上下文是零和游戏

单一 AI 的问题：

填满代码 → 没有业务上下文空间
填满客户历史 → 没有代码库空间

两层系统的优势：

OpenClaw (Zoe)：掌握所有业务上下文（客户数据、会议纪要、历史决策）
Codex/Claude Code：专注代码执行

层级	掌握内容
OpenClaw (Zoe)	Obsidian 笔记库、客户数据、会议纪要、成功/失败历史
Codex/Claude	代码库、技术实现

完整8步工作流

Step 1: 客户需求 → Zoe 梳理范围

补充客户积分（Zoe 有 admin API 访问权限）
从生产数据库拉取客户配置（只读权限，coding agents 永远不会拥有）
生成 Codex Agent（包含所有上下文的详细 prompt）

Step 2: 生成 Agent

每个 Agent 获得：

独立 worktree（隔离分支）
独立 tmux session（完整终端日志）

# 创建 worktree + 生成 agent
git worktree add ../feat-custom-templates -b feat/custom-templates origin/main
cd ../feat-custom-templates && pnpm install

tmux new-session -d -s "codex-templates" \
  -c "/Users/elvis/Documents/GitHub/medialyst-worktrees/feat-custom-templates" \
  "$HOME/.codex-agent/run-agent.sh templates gpt-5.3-codex high"

为什么选择 tmux？

Agent 跑偏了方向？不需要杀死它：tmux send-keys -t session "补充指令" Enter
可随时附加观察进度：tmux attach -t session

任务被记录在 .clawdbot/active-tasks.json 中。

Step 3: 循环监控

每10分钟运行的 cron job（改进版 Ralph Loop）：

检查 tmux session 是否存活
检查追踪分支的开放 PR
通过 gh cli 检查 CI 状态
自动重新生成失败的 agents（最多3次尝试）
仅在需要人工关注时发出警报

Step 4: Agent 创建 PR

Agent 通过 gh pr create --fill 提交 PR。

完成定义 (Definition of Done)：

PR 已创建
分支与 main 同步（无合并冲突）
CI 通过（lint、types、单元测试、E2E）
Codex 审查通过
Claude Code 审查通过
Gemini 审查通过
包含截图（如有 UI 变更）

Step 5: 自动代码审查

每个 PR 由 三个 AI 模型 审查：

审查者	特点	评价
Codex Reviewer	边缘案例专家，最彻底的审查，捕获逻辑错误、竞态条件	误报率极低 ⭐⭐⭐⭐⭐
Gemini Code Assist	免费且极其有用，捕获安全问题、扩展性问题	建议具体修复 ⭐⭐⭐⭐
Claude Code Reviewer	过于保守，大量 “consider adding…” 建议	除非标记关键否则跳过 ⭐⭐

Step 6: 自动化测试

CI 流程运行：

Lint 和 TypeScript 检查
单元测试
E2E 测试
Playwright 测试（针对预览环境）

新规则：UI 变更必须在 PR 描述中包含截图，否则 CI 失败。

Step 7: 人工审查

Telegram 通知：”PR #341 ready for review.”

此时：

CI 已通过
三个 AI 审查者已批准
截图显示 UI 变更
所有边缘案例已在审查评论中记录

人工审查时间：5-10分钟

Step 8: 合并

PR 合并后，每日 cron job 清理孤立的 worktrees 和任务注册表 json。

Ralph Loop V2

这不是静态循环，而是自适应学习系统：

当 Agent 失败时：

上下文不足？ → “只关注这三个文件”
方向错误？ → “客户想要的是 X，不是 Y。这是他们在会议上说的”
需要澄清？ → “这是客户的邮件和他们的公司介绍”

奖励信号：

CI 通过
三个代码审查通过
人工合并

任何失败都会触发循环。随着时间推移，Zoe 会写出更好的 prompt，因为她记得什么能 ship。

Agent 选型指南

Agent	最佳用途
Codex	主力，后端逻辑、复杂 bug、多文件重构。慢但彻底。90% 任务用它。
Claude Code	前端工作更快，git 操作权限问题更少。Codex 5.3 出来后用得少了。
Gemini	设计感。先用 Gemini 生成 HTML/CSS 规范，再交给 Claude Code 实现。

工作流示例：

账单系统 bug → Codex
按钮样式修复 → Claude Code
新仪表板设计 → Gemini 设计 → Claude 构建

当前瓶颈：RAM

每个 Agent 需要：

自己的 worktree
自己的 node_modules
并行运行 builds、类型检查、测试

5个 Agent 同时运行 = 5个并行 TypeScript 编译器 + 5个测试运行器

作者配置：

Mac Mini 16GB → 最多 4-5 个 Agent（会开始 swap）
已订购 Mac Studio M4 Max 128GB ($3,500)，3月底到货

如何设置

最简单的方式：

复制整篇文章到 OpenClaw，告诉它：

“为我的代码库实现这个 agent swarm 设置。”

它会读取架构、创建脚本、设置目录结构、配置 cron 监控。10分钟完成。

展望未来：一人百万美元公司

2026年，我们将看到大量一人百万美元公司。

模式：

AI 编排器作为自我的延伸（Zoe 对作者的意义）
委托工作给专门处理不同业务功能的 agents
- Engineering
- Customer support
- Ops
- Marketing
保持激光聚焦和完全控制

核心理念：

保持小规模
快速移动
每日 ship
少炒作，多记录真实业务构建

整理时间: 2026-02-24
来源: Twitter/X 精选
原文作者: @elvissun