哥们儿,今天AI圈又炸锅了!

你还记得前几天Google发布Gemini 3时候那个嚣张劲儿吗?搞得OpenAI那边都拉响红色警报了。结果没想到,今天凌晨OpenAI直接放了个大招——GPT-5.2系列正式发布!

这波是三连发

OpenAI这次一口气发了三个版本,有点像游戏里的青铜、白银、黄金段位:

GPT-5.2三个版本定位

  • GPT-5.2 Instant:日常小助手,反应快,适合处理一些简单任务
  • GPT-5.2 Pro:官方说这是"最智能、最可靠"的版本,专门啃硬骨头
  • GPT-5.2 Thinking:推理怪物,特别适合搞科研的大佬们

说白了就是分层定价,让你根据需求选择。不想花冤枉钱就用Instant,遇到复杂问题再祭出Pro或者Thinking。

编码能力炸裂

说实话,作为一个天天写代码的人,最关心的还是它写代码行不行。结果数据出来我直接看傻了:

SWE-Bench编码测试成绩

  • SWE-Bench Pro测试拿了55.6%
  • SWE-Bench Verified测试直接飙到80%,刷新历史记录

这啥概念?就好比以前AI写代码像个刚入行的实习生,现在直接升级成了3年经验的老油条。虽然还不能完全替代人,但已经能独立handle很多复杂任务了。

比专家快11倍,还便宜99%

与人类专家对比

这个数据真的让我怀疑人生了。

OpenAI做了个测试,让GPT-5.2和人类专家PK同样的任务:

指标GPT-5.2人类专家
达到专家水平比例70.9%-
完成速度11倍1倍
成本不到1%100%

你想想看,雇个专家可能一小时几百块,AI一分钟就干完还花不了几毛钱。当然,这不是说专家要失业,而是说AI已经能帮你处理大量重复性的专业工作了。

就像以前你得手动洗衣服,现在有洗衣机了。洗衣机不能完全替代你(总得有人把衣服放进去对吧),但确实解放了你大量时间。

长文本处理也很强

长文本处理能力

现在很多人用AI处理长文档,比如分析合同、总结报告什么的。GPT-5.2在这方面也有提升:

在256K token范围内,准确率接近100%。

256K token是什么概念?大概相当于一本三四百页的书。这意味着你可以把整本技术文档丢给它,让它帮你找关键信息,基本不会漏。

Altman说1月解除红色警报

前段时间Gemini 3发布后,据说OpenAI内部拉响了红色警报。不过CEO Altman今天出来说:

“Gemini 3对我们指标的影响可能没有我们担心的大”

言下之意就是:我们准备好了,不慌。预计明年1月前就能解除红色警报。

说实话,现在AI大战越来越激烈了。Google、OpenAI、Anthropic几家你追我赶,受益的还是我们这些用户——模型越来越强,价格越来越便宜。

API定价

API定价详情

说到价格,GPT-5.2的API定价如下:

  • 输入:$1.75 / 百万token
  • 输出:$14 / 百万token
  • 缓存输入有90%折扣

这个价格怎么说呢,比之前的模型是贵了点,但考虑到能力提升,性价比还是挺高的。特别是那个缓存折扣,如果你的应用有大量重复输入(比如系统提示词),能省不少钱。

我的看法

作为一个每天都在用AI辅助编程的开发者,我觉得GPT-5.2这波升级还是很实在的。编码能力的提升是实打实的,不是那种刷分但实际用起来差强人意的"假升级"。

不过话说回来,AI再强也只是工具。就像有了计算器不代表你可以不学数学一样,有了AI写代码也不代表你可以不理解代码逻辑。它最大的价值是帮你提效,而不是替代你思考。

好了,今天就聊到这儿。准备去体验一下新模型了,有什么新发现再跟你说!


本文整理自华尔街见闻报道,数据来源于OpenAI官方发布