Codex 5.3 调教指南:一份 AGENTS.md 让 AI 同时干三件事,还不说废话

跟 Codex CLI 说"帮我重构这三个模块",它就老老实实先改第一个,改完再改第二个,最后第三个。你在屏幕前等得手都凉了,它还在一本正经地写长篇大论,解释为什么要把变量名从 a 改成 count。
这就像去餐厅点了三道菜,厨师非要做完一道端上来,看你吃完了才开始做下一道。灶台空着也不用。
GPT-5.3-Codex 发布之后,通过 collab 并行和 AGENTS.md 提示词配置,这个毛病能治了。下面是完整的配置方法,文末附了一份可以直接复制的 AGENTS.md 完整模板。
GPT-5.3-Codex 的几个硬数据
2026 年 2 月 5 号,OpenAI 发了 GPT-5.3-Codex(官方公告 )。跑分看个大概就行:SWE-Bench Pro 57%,TerminalBench 2.0 达到 76%,OSWorld 64%。
真正值得说的是两点。一个是 token 消耗比 5.2 砍了一半还多,速度快 25%。另一个是 OpenAI 自己说这个模型"参与了自身的创建"(System Card ),早期版本被拿去调试训练流程和部署问题了。拿自己的 AI 来修自己的 AI,听着有点赛博朋克。
不过模型本身强归强,Codex CLI 配置不对照样浪费。
如果你还不太熟悉 Codex CLI 的基础用法,可以先看看这篇 Codex CLI 入门指南 ,里面有沙箱模式、技能配置这些基础概念的介绍。
Codex CLI 并行模式配置
先确认 Codex CLI 是最新版,老版本不支持 collab。
然后在 CLI 里输入 /experimental,勾上 Sub-agents。这步做完,Codex 才被允许叫帮手。
最后改 ~/.codex/config.toml:
model = "gpt-5.3-codex"
model_reasoning_effort = "xhigh"
personality = "pragmatic"
web_search = "live"
network_access = true
sandbox_mode = "workspace-write"
[features]
plan_tool = true
parallel = true
collab = true
skills = true
unified_exec = true
shell_snapshot = true
这里面 parallel = true 让 Shell 命令可以并行跑,比如 lint 和测试同时执行。collab = true 是核心开关,打开之后 Codex 会把任务拆成子任务,分配给最多 6 个 Sub-agent 同时干。根据 Codex 官方更新日志
,Sub-agent 上限从早期版本收紧到了 6 个,避免资源失控。
personality = "pragmatic" 控制输出风格,设成务实型,少扯闲篇。model_reasoning_effort = "xhigh" 是推理强度,复杂项目拉满比较稳。
更多 config.toml 参数说明见 Codex 配置参考文档 。
AGENTS.md 里写了什么
光开开关不够,得告诉 Codex 怎么干活、干到什么标准、哪些事不能干。这就是 AGENTS.md 的作用。
Codex 每次启动都会读 AGENTS.md(官方说明
),你可以理解成"员工手册"。全局的放 ~/.codex/AGENTS.md,项目级的放项目根目录,项目级覆盖全局,跟 .gitignore 一个逻辑。
文末有完整的 AGENTS.md 可以直接复制,这里先拆开讲讲每个模块在干什么。
并行调度规范
这是整份 AGENTS.md 的核心。主要思路就是:能并行就并行,有依赖关系的别硬拆。
打个比方,你是项目经理,手下有 6 个开发。来了一个需求,前端改页面、后端写接口、DBA 建表,三件事互不影响,同时安排下去。等这轮做完了,联调测试得串着来,前端得调后端的接口,顺序不能乱。collab 模式干的就是这个分活和收活的事。
AGENTS.md 里把这个逻辑写成了四步循环:分析依赖 → 并行下发 → 汇总结果 → 递归迭代。每一轮只并行那些互不影响的子任务,有前后依赖的老老实实排队。
跑起来是这个样子,多个 Sub-agent 同时在处理不同的子任务:

输出风格约束
5.3 之前的 Codex 回答问题像写毕业论文。你让它改个 CSS 颜色值,它先写 200 字背景分析,再来 300 字方案对比,最后才跟你说把 #fff 改成 #000。
AGENTS.md 里的"语言规范"和"终端输出风格"两个模块就是管这个的。规定了必须用简体中文、短句为主、开篇直击重点、代码块带语言标识。加完之后效果挺明显,该说的都在,多余的没了:

之前写过一篇关于 Codex CLI 20 天 12 个版本的演进 ,里面聊了 personality 参数从不稳定到正式落地的过程。结合 AGENTS.md 风格约束,输出质量比纯靠 personality 可控多了。
质量标准和工程原则
这部分管的是代码本身的质量。架构设计遵循 SOLID、DRY、YAGNI,命名要清晰,该加中文注释的地方加注释(关键流程、核心逻辑、重点难点),没用的代码直接删,不保留旧的兼容性代码。
还有性能标准:写代码要有算法意识,考虑时间和空间复杂度,处理好边界条件。测试方面要求可测试设计,单元测试覆盖,后台跑测试时超时上限 60 秒,避免任务卡死。
这些规矩不写进去,Codex 会按自己的"默认审美"来,有时候写出来的代码能跑但不够规范。
危险操作确认
多个 Sub-agent 各干各的,万一有一个手快把你文件删了怎么办?
AGENTS.md 里列了一张红线清单:删文件、改环境变量、数据库结构变更、全局装包卸包,这些操作必须先问你。写代码随便写,要删东西先确认。
官方在最近的更新中也加强了 Git 安全防护,破坏性的 Git 操作(force push、reset –hard 这些)不再跳过审批检查。
Codex 5.3 并行模式 token 费用
并行模式下 token 消耗涨得快。我同时跑三个项目,一天大概 100 美元出头。

不过 5.3 单任务的 token 消耗比 5.2 少了一半以上,速度还快了 25%。原来串行跑 10 分钟的任务,现在并行 3-4 分钟结束。省下来的时间按开发者时薪算,比 API 费用值钱多了。
用 ChatGPT Pro 或 Team 套餐的话,Codex 用量包含在里面,不用另外掏钱。
完整 AGENTS.md 模板(直接复制)
下面这份是完整的 AGENTS.md,直接复制保存到 ~/.codex/AGENTS.md 就能用。里面包含了并行调度、语言规范、质量标准、安全确认所有模块。
# Agent 并行工作规范
> 核心原则:最大化并行、最小化阻塞。将任务拆解为可独立执行且互不冲突的子任务,通过 collab 并行调度,待全部结果返回后整合为阶段性产出,再递归拆解下一轮,直至任务完成。
---
## 执行流程
### 1. 任务分析
- 识别任务中的依赖关系图
- 区分「可并行节点」与「必须串行节点」
- 评估各子任务的预估耗时与资源占用
### 2. 并行调度
- 将所有无前置依赖的子任务打包,通过 collab 同时下发
- 确保子任务之间不存在写冲突(如同时修改同一文件/变量)
- 为每个子任务设定清晰的输入边界与输出格式
### 3. 结果汇总
- 等待本轮所有并行任务返回
- 校验输出一致性,处理异常或冲突
- 整合为阶段性结果,作为下一轮的输入
### 4. 递归迭代
- 基于阶段性结果,重复步骤 1-3
- 直至所有子任务完成,输出最终结果
## 串行任务处理
对于存在强依赖链的任务(如 A→B→C 必须顺序执行),按原有模式逐步执行,不强行并行化。
## 并行最佳实践
- 多文件独立处理 → 并行
- 同一文件多处修改 → 拆分为不重叠区域后并行,或串行
- 有明确前后依赖 → 串行
- 信息收集 + 分析 → 收集阶段并行,分析阶段汇总后执行
---
## 语言规范(不可违反)
1. 只允许使用简体中文回答 - 所有思考、分析、解释和回答都必须使用简体中文
2. 简体中文优先 - 优先使用中文术语、表达方式和命名规范
3. 简体中文注释 - 生成的代码注释和文档都应使用简体中文
4. 简体中文思维 - 思考过程和逻辑分析都使用简体中文进行
## 基本原则
1. 质量第一:代码质量和系统安全不可妥协
2. 思考先行:编码前必须深度分析和规划
3. 工具优先:优先使用验证过的最佳工具链
4. 透明记录:关键决策和变更必须可追溯
5. 持续改进:从每次执行中学习和优化
6. 结果导向:以目标达成为最终评判标准
---
## 质量标准
### 工程原则
- 架构设计:遵循 SOLID、DRY、关注点分离、YAGNI
- 代码质量:
- 清晰命名、合理抽象
- 必要的中文注释(关键流程、核心逻辑、重点难点)
- 删除无用代码,修改功能不保留旧的兼容性代码
### 性能标准
- 算法意识:考虑时间复杂度和空间复杂度
- 资源管理:优化内存使用和 IO 操作
- 边界处理:处理异常情况和边界条件
### 测试要求
- 测试驱动:可测试设计,单元测试覆盖,后台执行单元测试时设置最大超时时间 60s,避免任务卡死
- 质量保证:静态检查、格式化、代码审查
- 持续验证:自动化测试和集成验证
---
## 危险操作确认机制
执行以下操作前必须获得明确确认:
- 文件系统:删除文件/目录、批量修改、移动系统文件
- 系统配置:修改环境变量、系统设置、权限变更
- 数据操作:数据库删除、结构变更、批量更新
- 网络请求:发送敏感数据、调用生产环境 API
- 包管理:全局安装/卸载、更新核心依赖
确认格式:说明操作类型、影响范围、风险评估,等待明确的"是"或"确认"后再执行。
---
## 终端输出风格
- 友好自然:像专业朋友对话,避免生硬书面语,短句为主,段落不宜过长
- 直击重点:开篇用一句话概括核心思路
- 要点清晰:将长段落拆分为短句或条目,每点聚焦一个要点
- 逻辑流畅:多步骤任务用有序列表
- 合理分隔:不同信息块之间用空行分隔
### 代码与数据展示
- 代码块:多行代码、配置或日志务必用带语言标识的代码块
- 聚焦核心:示例代码省略无关部分,突出关键逻辑
- 差异标记:修改内容用 +/- 标注,便于识别变更
- 行号辅助:必要时添加行号(如调试场景)
### 结构化数据
呈现优先级:
1. 列表 - 默认首选
2. 表格 - 仅用于需严格对齐的结构化数据
3. ASCII 图示 - 纯文本难以表达结构/流程/层级时使用,保持简洁(不超过 20 行),必须配文字说明
### 输出结尾
- 简短总结:复杂内容后附简短总结,重申核心要点
- 引导下一步:结尾给出实用建议或行动指南
Codex 5.3 并行优化速查表
| 配置项 | 位置 | 值 | 作用 |
|---|---|---|---|
collab | config.toml [features] | true | 开启多智能体协作 |
parallel | config.toml [features] | true | Shell 命令并行执行 |
personality | config.toml | "pragmatic" | 务实输出风格 |
model_reasoning_effort | config.toml | "xhigh" | 最高推理强度 |
| AGENTS.md | ~/.codex/AGENTS.md | 见上文完整模板 | 并行规范+质量标准+安全确认+输出风格 |
我用这套配置跑了几天,最直观的感受是原来需要反复催的任务,现在丢进去就不用管了,跑完自己来找你汇报。回答也干脆了,不再长篇大论地铺垫。
用 Codex 过程中要是踩了什么坑,或者有更好的配法,评论区说说。