LLM
共 7 篇

Sub-Agents vs Agent Teams:那个让你系统翻车的架构选择
真正的问题是「Sub-Agents和Agent Teams到底怎么选」。大多数人在任务复杂时立刻想到多Agent系统,但这往往是错误的起点。理解这个问题的答案,能帮你省下大量返工时间。
April 26, 2026 · 1 min · 139 words · 梦兽编程

你的AI Agent会思考,但不会记忆
AI Agent 能推理、能规划、能对话,但每次会话结束就忘得一干二净。Ghost 项目用一套纯 PostgreSQL 的基础设施解决这个问题,让数据库变成 Agent 的记忆宫殿。
March 26, 2026 · 2 min · 280 words · 梦兽编程

把 400B 大模型塞进 48G 内存:LLM in a Flash 背后的魔法
Apple 2023 年的一篇论文,让 4000 亿参数的模型跑在了普通 MacBook 上。核心技术 MoE + 量化,背后藏着一个关于’按需调用’的工程哲学。
March 24, 2026 · 2 min · 242 words · 梦兽编程

告别 90 秒的等待:oMLX 如何在 Mac 上对 Ollama 实现降维打击
oMLX 专为 Apple Silicon 打造,通过 MLX 框架、SSD KV 缓存和连续批处理,将长上下文场景下的 TTFT 从 90 秒降到 1-3 秒,全面超越 Ollama。
March 23, 2026 · 2 min · 378 words · 梦兽编程

一个 Agent 顶一千个:Ramp 教我的企业 AI 落地心法
Ramp 估值 320 亿美元,每年处理 1000 亿美元交易。他们的 AI 之路不走寻常路:不建一百个 Agent,而是用一个 Agent 配一千种技能。本文是他们工程师在大会上的完整分享。
March 19, 2026 · 3 min · 469 words · 梦兽编程

Karpathy 最新力作:200行代码实现完整GPT,这可能是最可爱的AI入门教程
Andrej Karpathy 又双叒叕搞事情了!这次他用 200 行纯 Python 代码实现了一个可训练、可推理的 GPT模型,没有任何依赖库。这可能是史上最简洁的大语言模型实现。
March 2, 2026 · 2 min · 369 words · 梦兽编程
Karpathy眼中的2025 LLM:六件让我刮目相看的AI趋势变化
Andrej Karpathy 2025 LLM年终总结深度解读:从RLVR到Vibe Coding,剖析2025��大模型领域的六大范式转变,探讨AI趋势新方向
December 20, 2025 · 1 min · 107 words · 梦兽编程
