很多技术团队的开会方式错了。他们聚在一起比较Pinecone、Weaviate、Milvus,觉得这才是正经的技术决策。但到2026年,这种开场方式正在浪费你的检索质量。
OpenAI、Azure AI Search、Pinecone、Weaviate的官方产品界面都在指向同一个结论:检索质量不再取决于你选了哪家向量数据库。真正决定RAG成败的,是更早的一系列架构决策——内容该索引什么、文件如何分块、元数据怎么支撑过滤和权限控制、重排序放在哪层、结果新鲜度要求多高、部署模式是否满足隐私与合规约束。
这些选择对答案质量和运营信任度的影响,往往超过Pinecone还是Weaviate的品牌差异。
向量数据库不再是第一个架构决策。OpenAI当前的检索和文件搜索栈把这一点做得很明显:托管流程自动完成分块、嵌入、索引,支持语义和关键词检索,并在查询时暴露元数据过滤器。OpenAI甚至将分块策略作为可配置的向量存储设置,默认自动分块为800个token、重叠400个token。这是一个直接信号——分块和过滤是设计决策,不是实现细节。
如果托管服务商都把分块策略、混合检索、元数据过滤提升为一等公民的产品概念,技术负责人就不该再假装向量后端单独决定检索质量。很多失败其实发生在更早阶段:源内容选得不好、分块边界糟糕、元数据薄弱、或者检索策略就只是"全部嵌入"。
混合检索现在是基线思维。Azure AI Search的混合搜索模型并行运行全文和向量查询,用倒数排序融合(Reciprocal Rank Fusion)合并结果。Weaviate的混合搜索结合向量和BM25F搜索,权重可调。Pinecone的搜索概览现在把语义、词汇、混合搜索视为标准类型,而非专门的边缘场景。
这很重要,因为真实的业务查询往往是混合查询——它们同时包含名称、代码、产品标识符、日期和领域术语。
热门跟贴