AI
共 18 篇

Sub-Agents vs Agent Teams:那个让你系统翻车的架构选择
真正的问题是「Sub-Agents和Agent Teams到底怎么选」。大多数人在任务复杂时立刻想到多Agent系统,但这往往是错误的起点。理解这个问题的答案,能帮你省下大量返工时间。

Claude Code 源码泄露:一场意外掀起的 Rust 重写浪潮
2026年3月,Claude Code 的50万行TypeScript源码意外泄露。社区的回应不是恐慌,而是用 Rust 重写整个项目。这场闹剧如何演变成 Rust 进军AI基础设施的最佳广告?

Claude Opus 4.7 偷偷涨价了?497 位开发者实测告诉你真相
497 位开发者的匿名实测数据揭示:Claude Opus 4.7 因系统提示词膨胀,比 4.6 平均多消耗 37.3% 的 token,API 成本同步上涨。本文用真实数据拆解这波’隐形涨价’的来龙去脉,以及三个立即可用的应对方案。

你的AI Agent会思考,但不会记忆
AI Agent 能推理、能规划、能对话,但每次会话结束就忘得一干二净。Ghost 项目用一套纯 PostgreSQL 的基础设施解决这个问题,让数据库变成 Agent 的记忆宫殿。

把 400B 大模型塞进 48G 内存:LLM in a Flash 背后的魔法
Apple 2023 年的一篇论文,让 4000 亿参数的模型跑在了普通 MacBook 上。核心技术 MoE + 量化,背后藏着一个关于’按需调用’的工程哲学。

告别 90 秒的等待:oMLX 如何在 Mac 上对 Ollama 实现降维打击
oMLX 专为 Apple Silicon 打造,通过 MLX 框架、SSD KV 缓存和连续批处理,将长上下文场景下的 TTFT 从 90 秒降到 1-3 秒,全面超越 Ollama。

Claude Code Channels 体验:让你的 AI 助手随叫随到
深入体验 Claude Code Channels 功能,通过 Telegram、Discord 等渠道随时向 AI 编程助手发送指令,解决人不在电脑前的尴尬。

一个 Agent 顶一千个:Ramp 教我的企业 AI 落地心法
Ramp 估值 320 亿美元,每年处理 1000 亿美元交易。他们的 AI 之路不走寻常路:不建一百个 Agent,而是用一个 Agent 配一千种技能。本文是他们工程师在大会上的完整分享。

Mistral Forge 深度解析:企业微调的核武器来了
花了 3 小时看官方文档,有些话不吐不快。Forge 想把微调变成一条龙服务,企业只需要喂数据,剩下的它全包。但门槛到底降到了什么程度?谁也不知道。

AI 编程遇到"审查瓶颈"?Mistral 甩出一个开源王炸
Mistral AI 发布首个开源 Lean 4 代码代理 Leanstral,让 AI 既能写代码又能自证正确性。这次我们聊聊形式化验证和 AI 编程的那些事儿。
