LLM | 梦兽编程

Sub-Agents vs Agent Teams：那个让你系统翻车的架构选择

真正的问题是「Sub-Agents和Agent Teams到底怎么选」。大多数人在任务复杂时立刻想到多Agent系统，但这往往是错误的起点。理解这个问题的答案，能帮你省下大量返工时间。

April 26, 2026 · 1 min · 139 words · 梦兽编程

AI Agent 能推理、能规划、能对话，但每次会话结束就忘得一干二净。Ghost 项目用一套纯 PostgreSQL 的基础设施解决这个问题，让数据库变成 Agent 的记忆宫殿。

March 26, 2026 · 2 min · 280 words · 梦兽编程

Apple 2023 年的一篇论文，让 4000 亿参数的模型跑在了普通 MacBook 上。核心技术 MoE + 量化，背后藏着一个关于’按需调用’的工程哲学。

March 24, 2026 · 2 min · 242 words · 梦兽编程

oMLX 专为 Apple Silicon 打造，通过 MLX 框架、SSD KV 缓存和连续批处理，将长上下文场景下的 TTFT 从 90 秒降到 1-3 秒，全面超越 Ollama。

March 23, 2026 · 2 min · 378 words · 梦兽编程

Ramp 估值 320 亿美元，每年处理 1000 亿美元交易。他们的 AI 之路不走寻常路：不建一百个 Agent，而是用一个 Agent 配一千种技能。本文是他们工程师在大会上的完整分享。

March 19, 2026 · 3 min · 469 words · 梦兽编程

Andrej Karpathy 又双叒叕搞事情了！这次他用 200 行纯 Python 代码实现了一个可训练、可推理的 GPT模型，没有任何依赖库。这可能是史上最简洁的大语言模型实现。

March 2, 2026 · 2 min · 369 words · 梦兽编程

Andrej Karpathy 2025 LLM年终总结深度解读：从RLVR到Vibe Coding，剖析2025��大模型领域的六大范式转变，探讨AI趋势新方向

December 20, 2025 · 1 min · 107 words · 梦兽编程