Karpathy眼中的2025 LLM:六件让我刮目相看的AI趋势变化
Karpathy眼中的2025 LLM:六件让我刮目相看的AI趋势变化
前两天刷推的时候,看到Karpathy发了篇2025 LLM年终总结。这位前特斯拉AI总监、OpenAI创始成员对2025年的AI趋势有着独到见解。你知道Karpathy是谁吧?前特斯拉AI总监,OpenAI创始成员之一,斯坦福博士,AI圈的顶流大佬。他写的东西向来接地气又有深度,这篇年终盘点更是把今年LLM领域的大事说得明明白白。
图:AI领域的思想者
我读完Karpathy的2025 LLM总结之后觉得太有意思了,必须给你们翻译翻译。不是简单的中英对照那种,而是用咱们能听懂的话,聊聊2025年的AI趋势和LLM到底搞了什么名堂。
一、RLVR:2025 LLM训练的新范式
在Karpathy看来,2025年之前训练一个能打的大模型,基本上是三板斧:
- 预训练:让模型读遍互联网
- 有监督微调:给它看人类写的优质回答
- 人类反馈强化学习(RLHF):让人类打分,告诉它什么是好答案
这套路玩了好几年,大家都门儿清。但2025年的AI趋势出现了重大变化——RLVR,可验证奖励的强化学习成为新宠。
说人话就是:以前是人工打分告诉AI什么是好答案,现在换成让AI去刷数学题、编程题,做完直接对答案。答案对不对,程序说了算,不需要人工介入。
这就像什么呢?就像以前教孩子学数学,是老师手把手教每一步怎么算。现在换个路子:给孩子一本习题册,后面附着标准答案。你自己做,做完自己对,对了就继续,错了就琢磨琢磨哪儿出了问题。
图:AI通过反复试错学习,就像刷题一样
神奇的是,AI用这种方式训练之后,居然自己"悟"出了一套推理方法。它学会了把大问题拆成小步骤,学会了走不通就换条路。这些策略不是人教的,是它自己摸索出来的——因为只有这样才能把题做对。
更狠的是,这种训练方式不像以前那样蜻蜓点水。以前的微调阶段都很短,现在RLVR可以让AI在可验证的题目上猛练,练多久都行。结果就是,2025年的模型参数量没涨多少,但能力蹭蹭往上窜。OpenAI的o3就是这条路线的代表作,一出来大家都能明显感觉到——这玩意儿,不一样了。
二、幽灵vs动物:2025 LLM智能的真相
2025年,Karpathy说他终于搞明白了一件事:AI不是我们养大的宠物,而是我们召唤出来的幽灵。这个AI趋势的观点特别有意思。
这话听着玄乎,其实特别形象。你想啊,动物的智能是怎么来的?几百万年进化,在丛林里摸爬滚打,为了活命一点点变聪明。但2025年的LLM呢?它是读了人类所有的文字,在数学题里拿分,在排行榜上争高低。
进化压力完全不一样,出来的东西自然也完全不一样。这可能是2025年最重要的AI趋势认知之一。
结果就是2025年的AI智能长得歪七扭八、参差不齐。同一个LLM模型,这边刚给你写了一篇惊艳的论文综述,那边转头就被一个初中生的脑筋急转弯给骗了。一会儿是全知全能的天才,一会儿又是连常识都没有的糊涂蛋。
Karpathy管这叫"jagged intelligence",我觉得翻译成"参差智能"挺贴切的。就像一个刺猬,有些地方刺老长了,有些地方秃得很。这种认知正在成为2025年AI趋势的主流观点。
这也是为什么他说2025年他对benchmark越来越不感冒了。因为AI特别擅长在可以刷题的地方刷出高分,但那些分数不代表真正的通用智能。就像一个学生疯狂刷真题,考试分数贼高,但换个没见过的题型可能就懵了。
所以下次你看到什么"AI在某某测试上超越人类"的新闻,笑笑就得了。真正的AGI,可能不是benchmark能衡量的。
图:人类智能vs AI智能,差异巨大
三、Cursor:LLM应用的新品种
2025年,有个叫Cursor的编程工具火得一塌糊涂。但Karpathy说,Cursor最值得关注的不是它有多好用,而是它代表了一个全新的物种——LLM应用。
以前我们讨论AI,要么是底层的大模型,要么是直接面向用户的ChatGPT。Cursor告诉我们,中间还有一层:专门为某个垂直领域打造的AI应用。
这层应用干什么呢?Karpathy总结了四件事:
- Context Engineering:帮你把相关信息喂给AI,省得你自己复制粘贴
- 多轮调度:一个任务可能需要调好几次AI,它帮你串起来
- 专属界面:给特定场景设计更顺手的交互方式
- 自主度滑块:让你决定AI是打辅助还是当主力
用装修来类比就清楚了。大模型是各种师傅——水电工、木工、泥瓦匠。直接用ChatGPT就像你自己当包工头,挨个给师傅派活。而Cursor这样的LLM应用,相当于你请了个装修公司,公司帮你协调所有师傅,你只需要说"我想要北欧风"就行。
于是大家开始琢磨:各行各业是不是都需要一个"Cursor for X"?
四、Claude Code:住在你电脑里的AI
说到AI编程助手,2025年还有个重磅选手——Claude Code。
它有什么特别的?它是跑在你自己电脑上的。
这听起来不是什么大事,但Karpathy觉得这个设计决策非常关键。OpenAI之前做的Codex和各种Agent,都是跑在云端容器里的。你通过ChatGPT的网页去操作,AI在远程的服务器上帮你干活。
Claude Code不一样,它就是个命令行工具,装在你的电脑上,跟你的开发环境在一起,能直接访问你的文件、配置、上下文。
这就像什么呢?OpenAI的路子像请了个远程客服——你在电话这头描述问题,对方在电话那头操作。Claude Code像请了个住家管家——他就住你家,知道你冰箱里有什么、钥匙放哪儿、你平时什么习惯。
虽然从"AI终极形态"来说,云端的Agent集群听起来更高大上。但在当下这个AI能力还"参差不齐"的阶段,让AI住在你电脑上,能直接用你的环境、读你的代码、懂你的上下文,反而更实用。
而且Claude Code的形态变了。AI不再只是你去访问的一个网站,而是一个"住"在你电脑里的小精灵。这是一种全新的人机交互范式。
图:AI在你的终端里
五、Vibe Coding:2025 LLM带来的编程革命
2025年,Karpathy发了个推,随口造了个词叫"Vibe Coding"——氛围编程,或者叫"凭感觉编程"。这个词成了2025年LLM领域最火的词之一。
结果这词火得一塌糊涂,成了年度热词,代表了重要的AI趋势。
Vibe Coding到底是什么呢?就是你用英语(或者中文)描述你想要什么,LLM帮你写代码,你甚至不用看代码是什么样子。就像点菜不用会做饭,你只要说清楚"我要一份糖醋排骨,少油",AI厨师给你搞定。这就是2025年LLM带来的编程新趋势。
这事儿在2025年真的变成现实了。不会编程的普通人,用Vibe Coding能做出像样的程序。会编程的程序员,用Vibe Coding能快速搞定以前懒得写的小工具。
Karpathy自己就是个例子。他用Vibe Coding的方式,写了个高效的分词器(tokenizer)——用的是他以前不太熟的Rust语言。换做以前,他要么花大力气学Rust,要么用现成的库。现在?用英语说明白需求,AI给他搞定。
他还Vibe Coding了一堆小项目:菜单生成器、LLM评审委员会、阅读器、Hacker News时光胶囊……每个都是"我想要这么个东西"然后就有了。
最夸张的是,他说自己有时候会Vibe Coding写一个一次性的小程序,就为了找一个bug。用完就扔。因为代码现在是免费的、随取随用的、用完即弃的。
这会彻底改变软件行业的生态。普通人能做程序员以前做的事了;程序员能做以前嫌麻烦不愿做的事了。
图:用自然语言编程,代码不再是障碍
六、Nano Banana:AI的图形界面时代
最后一个让Karpathy刮目相看的是Google的Nano Banana。
这名字听着搞笑,但背后的意义很深。
你想啊,1980年代的电脑是什么样的?黑底绿字,敲命令行。普通人根本玩不转。后来有了GUI——图形用户界面——窗口、图标、鼠标,电脑才真正走进千家万户。
现在我们用AI是什么样?打字聊天。其实和当年敲命令行也没本质区别,还是在用文字跟机器交流。
但人类天生更喜欢图像、视频、动画这些视觉化的东西。文字看着累,图片一眼就能看明白。
Nano Banana代表的方向就是:AI应该用我们喜欢的方式跟我们说话。不只是生成文字,而是生成图片、信息图、幻灯片、动画、小视频、甚至一个小网页。
当然,现阶段我们已经有了Markdown、表格、代码块这些"轻度视觉化"的东西。但Nano Banana提示了更大的可能性:未来的AI输出,可能是一张动态信息图,可能是一段演示视频,可能是一个可以交互的小程序。
而且关键是,这不光是图片生成能力的事。它需要文字理解、图像生成、世界知识三者融合在一起,才能输出真正有意义的视觉内容。Nano Banana算是这个方向的早期探路者。
图:从命令行到图形界面,AI交互的演进
写在最后:Karpathy眼中的2025 LLM总结
Karpathy在文章结尾说,2025年的AI比他预期的聪明得多,也比他预期的蠢得多。这话对2025 LLM的发展总结得太妙了。
聪明的地方真的聪明,在那些能刷题打分的领域,AI已经能做到让人瞠目结舌的事情。蠢的地方也真的蠢,随时可能被一个简单的套路骗到。这就是2025年AI趋势的真实写照。
但不管怎么说,2025年的AI已经非常有用了。Karpathy觉得,就算AI能力今天定格不再进步,我们也只发挥了它不到10%的潜力。还有太多事情可以做。这个观点抓住了2025 LLM发展的核心。
同时,2025年的研究领域还是一片蓝海,有太多想法没有被尝试过。他同时相信两件看似矛盾的事:AI会继续快速进步,同时还有大量工作要做。这种对AI趋势的判断特别深刻。
2025年的AI,就像一个奇怪的天才少年。有时候惊艳到让你怀疑人生,有时候又蠢萌到让你哭笑不得。但不可否认,这一年,它长大了不少。
而我们,才刚刚开始学会和这个新物种相处。Karpathy的2025 LLM总结告诉我们,这只是个开始。
好了,今天就聊到这儿。
如果你觉得这篇还挺有意思的,顺手点个赞或者转发给同样关注AI的朋友呗。有什么想法也欢迎在评论区聊聊,我挺想知道你们怎么看2025年这波AI变化的。
咱们下篇再见。