Codex CLI 20天怒更12个版本，这些新功能让我的编程效率翻倍

别再只会用 Codex CLI 生成代码了

说出来你可能不信。

就在20天前，我第一次听说 Codex CLI 这个 CLI 工具。那时候它还是个"能写代码的 AI 编程助手"，功能嘛，和市面上那些 copilot、cursor 啥的差不多——你给它一个需求，它帮你生成一段代码。

然后呢？

然后它就开始疯狂更新。1月16号到2月5号，20天时间，12个版本。我眼睁睁看着这个 OpenAI 出品的 AI 编程助手从一个"能写代码的实习生"，变成了一个"能独立思考、还能拉帮结派帮你干活的全能助手"，开发效率直接翻倍。

说实话，这种更新速度让我想起了当年微信抢红包功能上线的日子——你这边还在研究怎么用，人家那边已经迭代了三个版本。

今天这篇文章，我想带你快速过一遍这12个版本里最实用的新特性。不用全看，看完你至少能说清楚：Codex CLI 这个 CLI 工具到底有什么不一样的地方？它凭啥值得你专门装一个新工具来提升开发效率？

从"单打独斗"到"团队协作"：Plan 模式的进化

场景类比：带团队 vs 独自搬砖

想象一下你要装修一套房子。

独自搬砖型：你告诉工人"去把客厅的墙刷白"，工人刷完墙，你再说"去把卧室的地板铺上"，工人铺完地板，你再说"去把厨房的橱柜装上"……一整天下来，你啥也没干，光顾着发号施令了。

带团队型：你告诉工头"我要装修一套三室一厅"，工头会自己安排：油漆工先刷墙，木工后铺地板，橱柜师傅最后进场。你只需要在关键节点确认一下方向对不对。

Codex CLI 的 Plan 模式，就是这个"工头"的角色。

演进路线一览

让我给你画个时间线，你就知道这个功能有多受重视：

v0.88（1月19日）：开始搭建协作模式的基础架构。这时候还是"内部测试版"，普通用户用不了。
v0.90（1月25日）：Beta 版发布，普通用户终于能用了。主agent可以派研究agent去查资料，再派编程agent来写代码。
v0.91（1月25日）：同一天发布？没错，这就是迭代速度。子agent数量从12个砍到6个——防止它太浪，一个任务派出十个小弟，最后啥都干不完。
v0.93（1月31日）：计划生成过程变成"流式视图"。以前你提交一个任务，它闷头想半天，最后给你一个完整计划。现在呢？你能看着它一步步思考，实时调整方向。
v0.94（2月2日）：Plan 模式正式成为默认模式。新用户一进来，引导语都改成"告诉我你想完成什么，我来帮你制定计划"了。
v0.95（2月4日）：终于支持贴图了！你可以直接把设计稿截图扔给它：“照着这个图给我写个登录页”。它能看懂。

讲真，v0.95 那个贴图功能出来的时候，我试着扔了一张手绘的流程草图进去，结果它给我生成了一个带注释的状态机图……我当时就想，这要是早出来两年，我大学那门"软件工程"的期末大作业能少熬三个通宵。

什么时候用 Plan 模式？

我个人的经验是：任务超过2小时、涉及多个环节、需要查资料的时候，直接用 Plan 模式，开发效率能提升一大截。

比如"给我写一个完整的用户注册流程，后端用Go，前端用React，数据库用PostgreSQL，还要包含邮件验证"——这种任务拆成 Plan 模式扔进去，它能自己规划好步骤，你只需要确认方向就行。

如果只是"帮我写一个函数，把数组里的重复元素去掉"这种30秒搞定的事，直接用默认对话模式更快。

Skills 系统：这才是真正的"自定义 AI 编程助手"

场景类比：手机 App vs 内置功能

Codex CLI 本身是一个 CLI 工具，但 Skills 让它变成了一个平台。

你可以把 Skills 理解为"给 Codex CLI 装插件"。它不是一个死的功能列表，而是一个可以无限扩展的能力池。

从"能干活"到"会干活"的进化

v0.86（1月16日）：引入 SKILL.toml 元数据文件。在这之前，技能就是一个 prompt.txt，没有名字、没有描述、没有图标。现在有了元数据，技能可以有自己的名字、图标、颜色和描述， TUI 界面里看起来清清楚楚。
v0.94（2月2日）：支持从项目目录的 .agents/skills 加载技能。什么意思？你的项目可以自带专属技能，团队成员一拉代码，这些技能就自动加载进来。不需要每个人单独配置。
v0.95（2月4日）：支持从远程 Git 仓库安装技能。社区有人写了一个"数据库迁移助手"，你一行命令就能装上：codex skills install https://github.com/xxx/db-migrator.git。
v0.97（2月5日）：实时热更新。你改了 prompt.md 保存，Codex CLI 检测到变化，自动重新加载技能。不用重启应用，不用重启服务，像改代码一样改 AI prompt。

举个实际例子

我团队里有个数据科学项目，每周都要处理一批原始数据。我们写了一个 data_prep 技能：

# SKILL.toml
name = "数据预处理"
description = "清洗和预处理原始数据文件"
icon = "📊"

# prompt.md
你是数据预处理助手。当你被调用时，你会：
1. 读取用户指定的原始数据文件
2. 用中位数填充数值列的缺失值，用众数填充分类列的缺失值
3. 删除重复行
4. 将数值列归一化到 0-1 范围
5. 保存清洗后的数据，文件名加 "_cleaned" 后缀

把这个技能往项目 .agents/skills/data_prep 目录一扔，团队里任何人运行 Codex CLI，这个技能自动出现。其他人想用？拉一下代码就有了。

以前这种流程我们都是写文档、开会培训、写脚本。现在？一个技能文件搞定所有，团队开发效率直接起飞。

安全与权限：不是"能不能干"，而是"干之前先问你"

场景类比：出门不带钱 vs 出门不带身份证

Codex CLI 这种 AI 编程助手，说白了是个能替你操作电脑的程序。它能读你的文件、执行命令、访问网络——要是没点限制，那可比你自己胆子大多了。

所以从一开始，Codex CLI 就把安全放在了核心位置。

权限系统的演进

v0.86（1月16日）：支持禁用 Web 搜索。敏感环境里，你希望 AI 别联网查东西，一行配置搞定。
v0.89（1月22日）：新增 /permissions 命令。/permissions allow all 直接放行所有操作，适合你信任它、但不想一次次点确认的场景。
v0.90（1月25日）：网络沙箱代理。可以精确到"只能访问哪些域名"——比如只允许访问 GitHub、PyPI 和内部文档站点，其他一概免谈。
v0.95（2月4日）：强化 Git 命令安全。git push --force、git reset --hard 这种危险操作，必须明确审批，不再自动通过。
v0.97（2月5日）：MCP 工具审批记忆。点一次"允许并记住"，同类的工具调用再也不弹窗问你。

什么时候需要特别注意安全？

如果你在处理以下场景，建议打开严格权限模式：

公司内部代码，涉及商业机密
生产环境服务器，具有写入权限
多人共享的开发环境
任何涉及用户数据、支付信息的项目

我个人的做法是：本地开发随便造，上生产环境前先切到严格模式确认一遍。

那些"用一次就回不去"的开发效率神器

Web 搜索缓存（v0.92）

同一个问题问两遍，第二次秒回。因为搜索结果默认缓存了。

这对"边想边问"的工作流特别友好。你问完一个问题，过一会儿又想起来另一个相关问题——不用让 AI 再去查一遍网，直接用缓存的结果。

Shell 别名识别（v0.87）

你 .bashrc 里写的 k=kubectl，Codex CLI 现在能识别了。

以前和 AI 协作最痛苦的事：你知道你有个别名，但 AI 不认识。你要么展开写全称，要么先告诉 AI 这个别名是什么意思。

现在？你怎么用终端，AI 就怎么用终端。

线程过滤与恢复（v0.92）

/threads --filter "database connection pool" 找历史会话。找到后发现归档了？thread/unarchive 把它恢复。

以前翻半天聊天记录，现在一条命令搞定。

macOS 应用启动器（v0.95）

codex app /path/to/my-project 注册一个应用，之后 Spotlight 搜索应用名直接启动。

我试了一下，注册了四个常用项目。现在打开项目不需要 cd 命令了——直接 Cmd+Space，打项目名，回车，直接进项目上下文。

你可能会问的问题

Q：Codex CLI 和 Copilot、Cursor 有什么区别？

最大的区别是"自主性"。

Copilot 是"你写一行代码，它补全一半"。Cursor 是"你描述需求，它生成一个文件"。Codex CLI 这个 OpenAI 出品的 AI 编程助手是"你给一个目标，它自己规划、查资料、写代码、测试、提交"。

它更像一个"初级程序员助理"——能独立完成一些任务，但需要你把方向，帮你提升开发效率。

Q：这个 AI 编程助手上手难度怎么样？

坦白说，比 Copilot 难一点。Copilot 装个插件就能用，Codex CLI 这个 CLI 工具需要装 CLI、配置环境、学习新的交互模式。

但如果你每天花 3 小时以上在编程上，值得投入 1-2 小时把这个 AI 编程助手学会。它能帮你省回来的时间，远远超过这个投入。

Q：我该从哪个版本开始用？

直接用最新版。目前最新是 v0.97，所有功能都稳定了。

Q：计划模式会不会太"重"？

不会。Plan 模式可以随时退出到对话模式。你扔一个任务进去，如果觉得它的计划太复杂，随时可以说"太复杂了，先写个简单的"。

下一步：从"试试看"到"用起来"提升开发效率

如果你决定试试 Codex CLI，我建议这么开始：

装上它：macOS 用 brew install，Linux 用相应的包管理器
先别折腾配置：默认配置够用，直接 codex 跑起来
从一个小任务开始：比如"写一个 Python 脚本，合并两个 CSV 文件"
试试 Plan 模式：扔一个需要查资料的任务进去，观察它怎么工作
了解权限设置：正式用在项目里之前，搞清楚 /permissions 和 /debug-config

20天12个版本的迭代速度，说明 OpenAI 正在把 Codex CLI 这个 AI 编程助手当成核心产品来打造。这个时间点入场，你学到的每一样东西，都会在未来变成开发效率优势。

觉得这篇文章有用吗？

点赞：如果觉得有帮助，点个赞让更多人看到
转发：分享给可能需要的朋友或同事
关注：关注梦兽编程，不错过更多实用技术文章
留言：你现在用的是什么 AI 编程工具？有什么痛点想让它帮你解决？想提升开发效率吗？

你的支持是我持续创作的最大动力！

别再只会用 Codex CLI 生成代码了#

从"单打独斗"到"团队协作"：Plan 模式的进化#

场景类比：带团队 vs 独自搬砖#

演进路线一览#

什么时候用 Plan 模式？#

Skills 系统：这才是真正的"自定义 AI 编程助手"#

场景类比：手机 App vs 内置功能#

从"能干活"到"会干活"的进化#

举个实际例子#

安全与权限：不是"能不能干"，而是"干之前先问你"#

场景类比：出门不带钱 vs 出门不带身份证#

权限系统的演进#

什么时候需要特别注意安全？#

那些"用一次就回不去"的开发效率神器#

Web 搜索缓存（v0.92）#

Shell 别名识别（v0.87）#

线程过滤与恢复（v0.92）#

macOS 应用启动器（v0.95）#

你可能会问的问题#

Q：Codex CLI 和 Copilot、Cursor 有什么区别？#

Q：这个 AI 编程助手上手难度怎么样？#

Q：我该从哪个版本开始用？#

Q：计划模式会不会太"重"？#

下一步：从"试试看"到"用起来"提升开发效率#