200行代码变1行：这个库把RAG塞进了对象里|上下文|代码|向量|索引|调用

做RAG的人都在交一种隐形税。向量数据库、嵌入流水线、分块逻辑、检索调优、令牌预算管理、上下文注入——教程写到200行还没看到输出。所有这套基础设施只为回答一个问题：输入内容和我的文档匹不匹配？

这不是数据库问题。是你的对象不知道自己该遵守什么规则。

大语言模型懂很多世界知识，但不懂你的定价层级、排除政策、团队上季度写的合规条款。标准做法是给每个需要接地行为的模型搭一套RAG流水线，把正确文档块检索出来塞进提示词。能跑通，但把一个10行功能变成了200行基础设施项目。

问题不在检索。问题在于你的领域对象没办法说："我创建的时候，去查一下这份文档。"

exomodel把这个变成了一行方法重写。

假设你在做提案生成器，业务规则存在markdown里：最低项目预算1万美元、定价必须含10%安全边际、不接烟草或赌博行业客户、时间估算要留两周QA缓冲。你的对象需要知道这份文档。代码是这样写的：

from exomodel import ExoModel

class Proposal(ExoModel):
client: str = ""
project_title: str = ""
budget: float = 0.0
timeline_weeks: int = 0
summary: str = ""

@classmethod
def get_rag_sources(cls):
return ["proposal_rules.md"]

集成到此结束。没有流水线，没有数据库，没有分块代码。

p = Proposal.create("为Acme Corp起草提案——云迁移项目，8周")
print(p.budget) # 45000.0（已含10%安全边际）
print(p.timeline_weeks) # 10（8周+2周QA缓冲）

对象自己应用了规则。提示词工程零行代码。

实际发生了什么？当get_rag_sources()被定义时，exomodel在内部、在调用时、无外部依赖地跑完整RAG栈：读取列出的每个文件、把内容切成重叠片段、嵌入到内存向量存储、检索与输入最相关的章节、和schema一起注入提示词。没有外部数据库，没有要配置的嵌入API，没有要管理的持久状态。索引在请求期间活在内存里。