检索增强生成(RAG)系统面临一个经典难题:向量搜索擅长语义匹配,却容易漏掉精确的关键词;传统关键词搜索相反,能命中特定术语,却理解不了同义词。
混合搜索(Hybrid Search)把两者打包——向量检索+关键词检索并行跑,结果合并。但合并只是第一步,真正决定输出质量的是重排序(Re-Ranking)。
打开网易新闻 查看精彩图片
生产环境的痛点在于延迟。两路检索已经 doubling 了调用成本,如果再用大模型做重排,响应时间直接爆炸。业界的折中方案是用轻量级的交叉编码器(Cross-Encoder)替代生成模型,在精度和速度之间找平衡点。
打开网易新闻 查看精彩图片
另一个隐藏成本是索引维护。混合搜索意味着要同时维护向量库和倒排索引,数据更新时的同步策略、版本回滚、灰度验证,都是工程团队要啃的硬骨头。
打开网易新闻 查看精彩图片
热门跟贴