RAG
共 3 篇

RAG 检索增强生成实战:别让你的大模型闭卷考试了,给它开本书
RAG 检索增强生成教程:四步用 Embedding 向量搜索 + Claude 搭建企业知识库问答。Contextual Retrieval 让检索失败率从 5.7% 降到 1.9%,附完整 Python 代码和 Voyage AI 模型选型对比。
February 10, 2026 · 3 min · 491 words · 梦兽编程

AI客服:AI-First 客服第三天就崩,往往不是模型,是账单
AI-First 客服听起来像降本增效,但落地常在三天翻车:长尾问题、权限动作、知识回流、可观测性、评估体系。本文用工单系统视角拆解原因,给出 AI客服 + RAG 的分级兜底、人机协作与可回滚上线方案。
December 25, 2025 · 2 min · 380 words · 梦兽编程

pgvector 0.8.0 来了,PostgreSQL 用户还需要专用向量数据库吗?
你的 CTO 批了 5 万美元的 Pinecone 合同,实习生 47 分钟用 pgvector 免费搞定。pgvector 0.8.0 新增迭代扫描和智能查询规划,让大多数场景下的专用向量数据库变得多余
January 31, 2025 · 1 min · 152 words · 梦兽编程