Codex 5.3 调教指南：一份 AGENTS.md 让 AI 同时干三件事，还不说废话

跟 Codex CLI 说"帮我重构这三个模块"，它就老老实实先改第一个，改完再改第二个，最后第三个。你在屏幕前等得手都凉了，它还在一本正经地写长篇大论，解释为什么要把变量名从 a 改成 count。

这就像去餐厅点了三道菜，厨师非要做完一道端上来，看你吃完了才开始做下一道。灶台空着也不用。

GPT-5.3-Codex 发布之后，通过 collab 并行和 AGENTS.md 提示词配置，这个毛病能治了。下面是完整的配置方法，文末附了一份可以直接复制的 AGENTS.md 完整模板。

GPT-5.3-Codex 的几个硬数据

2026 年 2 月 5 号，OpenAI 发了 GPT-5.3-Codex（官方公告）。跑分看个大概就行：SWE-Bench Pro 57%，TerminalBench 2.0 达到 76%，OSWorld 64%。

真正值得说的是两点。一个是 token 消耗比 5.2 砍了一半还多，速度快 25%。另一个是 OpenAI 自己说这个模型"参与了自身的创建"（System Card ），早期版本被拿去调试训练流程和部署问题了。拿自己的 AI 来修自己的 AI，听着有点赛博朋克。

不过模型本身强归强，Codex CLI 配置不对照样浪费。

如果你还不太熟悉 Codex CLI 的基础用法，可以先看看这篇 Codex CLI 入门指南，里面有沙箱模式、技能配置这些基础概念的介绍。

Codex CLI 并行模式配置

先确认 Codex CLI 是最新版，老版本不支持 collab。

然后在 CLI 里输入 /experimental，勾上 Sub-agents。这步做完，Codex 才被允许叫帮手。

最后改 ~/.codex/config.toml：

model = "gpt-5.3-codex"
model_reasoning_effort = "xhigh"
personality = "pragmatic"
web_search = "live"
network_access = true
sandbox_mode = "workspace-write"

[features]
plan_tool = true
parallel = true
collab = true
skills = true
unified_exec = true
shell_snapshot = true

这里面 parallel = true 让 Shell 命令可以并行跑，比如 lint 和测试同时执行。collab = true 是核心开关，打开之后 Codex 会把任务拆成子任务，分配给最多 6 个 Sub-agent 同时干。根据 Codex 官方更新日志，Sub-agent 上限从早期版本收紧到了 6 个，避免资源失控。

personality = "pragmatic" 控制输出风格，设成务实型，少扯闲篇。model_reasoning_effort = "xhigh" 是推理强度，复杂项目拉满比较稳。

更多 config.toml 参数说明见 Codex 配置参考文档。

AGENTS.md 里写了什么

光开开关不够，得告诉 Codex 怎么干活、干到什么标准、哪些事不能干。这就是 AGENTS.md 的作用。

Codex 每次启动都会读 AGENTS.md（官方说明），你可以理解成"员工手册"。全局的放 ~/.codex/AGENTS.md，项目级的放项目根目录，项目级覆盖全局，跟 .gitignore 一个逻辑。

文末有完整的 AGENTS.md 可以直接复制，这里先拆开讲讲每个模块在干什么。

并行调度规范

这是整份 AGENTS.md 的核心。主要思路就是：能并行就并行，有依赖关系的别硬拆。

打个比方，你是项目经理，手下有 6 个开发。来了一个需求，前端改页面、后端写接口、DBA 建表，三件事互不影响，同时安排下去。等这轮做完了，联调测试得串着来，前端得调后端的接口，顺序不能乱。collab 模式干的就是这个分活和收活的事。

AGENTS.md 里把这个逻辑写成了四步循环：分析依赖 → 并行下发 → 汇总结果 → 递归迭代。每一轮只并行那些互不影响的子任务，有前后依赖的老老实实排队。

跑起来是这个样子，多个 Sub-agent 同时在处理不同的子任务：

Codex 5.3 并行效果图

输出风格约束

5.3 之前的 Codex 回答问题像写毕业论文。你让它改个 CSS 颜色值，它先写 200 字背景分析，再来 300 字方案对比，最后才跟你说把 #fff 改成 #000。

AGENTS.md 里的"语言规范"和"终端输出风格"两个模块就是管这个的。规定了必须用简体中文、短句为主、开篇直击重点、代码块带语言标识。加完之后效果挺明显，该说的都在，多余的没了：

Codex 5.3 输出风格效果图

之前写过一篇关于 Codex CLI 20 天 12 个版本的演进，里面聊了 personality 参数从不稳定到正式落地的过程。结合 AGENTS.md 风格约束，输出质量比纯靠 personality 可控多了。

质量标准和工程原则

这部分管的是代码本身的质量。架构设计遵循 SOLID、DRY、YAGNI，命名要清晰，该加中文注释的地方加注释（关键流程、核心逻辑、重点难点），没用的代码直接删，不保留旧的兼容性代码。

还有性能标准：写代码要有算法意识，考虑时间和空间复杂度，处理好边界条件。测试方面要求可测试设计，单元测试覆盖，后台跑测试时超时上限 60 秒，避免任务卡死。

这些规矩不写进去，Codex 会按自己的"默认审美"来，有时候写出来的代码能跑但不够规范。

危险操作确认

多个 Sub-agent 各干各的，万一有一个手快把你文件删了怎么办？

AGENTS.md 里列了一张红线清单：删文件、改环境变量、数据库结构变更、全局装包卸包，这些操作必须先问你。写代码随便写，要删东西先确认。

官方在最近的更新中也加强了 Git 安全防护，破坏性的 Git 操作（force push、reset –hard 这些）不再跳过审批检查。

Codex 5.3 并行模式 token 费用

并行模式下 token 消耗涨得快。我同时跑三个项目，一天大概 100 美元出头。

Codex 5.3 Token 消耗截图

不过 5.3 单任务的 token 消耗比 5.2 少了一半以上，速度还快了 25%。原来串行跑 10 分钟的任务，现在并行 3-4 分钟结束。省下来的时间按开发者时薪算，比 API 费用值钱多了。

用 ChatGPT Pro 或 Team 套餐的话，Codex 用量包含在里面，不用另外掏钱。

完整 AGENTS.md 模板（直接复制）

下面这份是完整的 AGENTS.md，直接复制保存到 ~/.codex/AGENTS.md 就能用。里面包含了并行调度、语言规范、质量标准、安全确认所有模块。

# Agent 并行工作规范

> 核心原则：最大化并行、最小化阻塞。将任务拆解为可独立执行且互不冲突的子任务，通过 collab 并行调度，待全部结果返回后整合为阶段性产出，再递归拆解下一轮，直至任务完成。

---

## 执行流程

### 1. 任务分析
- 识别任务中的依赖关系图
- 区分「可并行节点」与「必须串行节点」
- 评估各子任务的预估耗时与资源占用

### 2. 并行调度
- 将所有无前置依赖的子任务打包，通过 collab 同时下发
- 确保子任务之间不存在写冲突（如同时修改同一文件/变量）
- 为每个子任务设定清晰的输入边界与输出格式

### 3. 结果汇总
- 等待本轮所有并行任务返回
- 校验输出一致性，处理异常或冲突
- 整合为阶段性结果，作为下一轮的输入

### 4. 递归迭代
- 基于阶段性结果，重复步骤 1-3
- 直至所有子任务完成，输出最终结果

## 串行任务处理

对于存在强依赖链的任务（如 A→B→C 必须顺序执行），按原有模式逐步执行，不强行并行化。

## 并行最佳实践

- 多文件独立处理 → 并行
- 同一文件多处修改 → 拆分为不重叠区域后并行，或串行
- 有明确前后依赖 → 串行
- 信息收集 + 分析 → 收集阶段并行，分析阶段汇总后执行

---

## 语言规范（不可违反）

1. 只允许使用简体中文回答 - 所有思考、分析、解释和回答都必须使用简体中文
2. 简体中文优先 - 优先使用中文术语、表达方式和命名规范
3. 简体中文注释 - 生成的代码注释和文档都应使用简体中文
4. 简体中文思维 - 思考过程和逻辑分析都使用简体中文进行

## 基本原则

1. 质量第一：代码质量和系统安全不可妥协
2. 思考先行：编码前必须深度分析和规划
3. 工具优先：优先使用验证过的最佳工具链
4. 透明记录：关键决策和变更必须可追溯
5. 持续改进：从每次执行中学习和优化
6. 结果导向：以目标达成为最终评判标准

---

## 质量标准

### 工程原则

- 架构设计：遵循 SOLID、DRY、关注点分离、YAGNI
- 代码质量：
  - 清晰命名、合理抽象
  - 必要的中文注释（关键流程、核心逻辑、重点难点）
  - 删除无用代码，修改功能不保留旧的兼容性代码

### 性能标准

- 算法意识：考虑时间复杂度和空间复杂度
- 资源管理：优化内存使用和 IO 操作
- 边界处理：处理异常情况和边界条件

### 测试要求

- 测试驱动：可测试设计，单元测试覆盖，后台执行单元测试时设置最大超时时间 60s，避免任务卡死
- 质量保证：静态检查、格式化、代码审查
- 持续验证：自动化测试和集成验证

---

## 危险操作确认机制

执行以下操作前必须获得明确确认：

- 文件系统：删除文件/目录、批量修改、移动系统文件
- 系统配置：修改环境变量、系统设置、权限变更
- 数据操作：数据库删除、结构变更、批量更新
- 网络请求：发送敏感数据、调用生产环境 API
- 包管理：全局安装/卸载、更新核心依赖

确认格式：说明操作类型、影响范围、风险评估，等待明确的"是"或"确认"后再执行。

---

## 终端输出风格

- 友好自然：像专业朋友对话，避免生硬书面语，短句为主，段落不宜过长
- 直击重点：开篇用一句话概括核心思路
- 要点清晰：将长段落拆分为短句或条目，每点聚焦一个要点
- 逻辑流畅：多步骤任务用有序列表
- 合理分隔：不同信息块之间用空行分隔

### 代码与数据展示

- 代码块：多行代码、配置或日志务必用带语言标识的代码块
- 聚焦核心：示例代码省略无关部分，突出关键逻辑
- 差异标记：修改内容用 +/- 标注，便于识别变更
- 行号辅助：必要时添加行号（如调试场景）

### 结构化数据

呈现优先级：
1. 列表 - 默认首选
2. 表格 - 仅用于需严格对齐的结构化数据
3. ASCII 图示 - 纯文本难以表达结构/流程/层级时使用，保持简洁（不超过 20 行），必须配文字说明

### 输出结尾

- 简短总结：复杂内容后附简短总结，重申核心要点
- 引导下一步：结尾给出实用建议或行动指南

Codex 5.3 并行优化速查表

配置项	位置	值	作用
`collab`	config.toml [features]	`true`	开启多智能体协作
`parallel`	config.toml [features]	`true`	Shell 命令并行执行
`personality`	config.toml	`"pragmatic"`	务实输出风格
`model_reasoning_effort`	config.toml	`"xhigh"`	最高推理强度
AGENTS.md	`~/.codex/AGENTS.md`	见上文完整模板	并行规范+质量标准+安全确认+输出风格

我用这套配置跑了几天，最直观的感受是原来需要反复催的任务，现在丢进去就不用管了，跑完自己来找你汇报。回答也干脆了，不再长篇大论地铺垫。

用 Codex 过程中要是踩了什么坑，或者有更好的配法，评论区说说。

GPT-5.3-Codex 的几个硬数据#

Codex CLI 并行模式配置#

AGENTS.md 里写了什么#

并行调度规范#

输出风格约束#

质量标准和工程原则#

危险操作确认#

Codex 5.3 并行模式 token 费用#

完整 AGENTS.md 模板（直接复制）#

Codex 5.3 并行优化速查表#