RAG
共 4 篇
Grounding:搜索增强生成,让回答更可靠
详解 ADK Go 中的 Grounding 机制——通过 Google Search Grounding 让 Agent 的回答基于真实搜索结果,减少幻觉。
May 29, 2026 · 4 min · 834 words · 梦兽编程

RAG 检索增强生成实战:别让你的大模型闭卷考试了,给它开本书
RAG 检索增强生成教程:四步用 Embedding 向量搜索 + Claude 搭建企业知识库问答。Contextual Retrieval 让检索失败率从 5.7% 降到 1.9%,附完整 Python 代码和 Voyage AI 模型选型对比。
February 10, 2026 · 3 min · 491 words · 梦兽编程

AI客服:AI-First 客服第三天就崩,往往不是模型,是账单
AI-First 客服听起来像降本增效,但落地常在三天翻车:长尾问题、权限动作、知识回流、可观测性、评估体系。本文用工单系统视角拆解原因,给出 AI客服 + RAG 的分级兜底、人机协作与可回滚上线方案。
December 25, 2025 · 2 min · 380 words · 梦兽编程

pgvector 0.8.0 来了,PostgreSQL 用户还需要专用向量数据库吗?
你的 CTO 批了 5 万美元的 Pinecone 合同,实习生 47 分钟用 pgvector 免费搞定。pgvector 0.8.0 新增迭代扫描和智能查询规划,让大多数场景下的专用向量数据库变得多余
January 31, 2025 · 1 min · 152 words · 梦兽编程
