Thessori：用Qwen自动搞定文献综述，但人得在场|qwen|thessori|文献|索引|论文

我搭了个工具，叫Thessori——让它替你整理文献综述，最后还能导出Markdown、LaTeX或PDF。不为别的，就是被那几百篇没读的论文逼急了。每个研究项目开始都一样：一个问题，一堆文献，得先筛出相关的，再读完，然后找出“没人试过的事”。前两步明明是机械活，市面上多数工具却只在读完后才帮你整理。Thessori更靠前一步，你给研究问题，它还你一份能直接拿给导师看的综述。

这段代码是为Qwen Cloud黑客松里的“自动驾驶代理”赛道写的。你别选错模型：Plus还是Max，得自己挑。输完研究问题，代理同时跑去arXiv和Semantic Scholar搜，再用Qwen对结果排个名，然后把挑出的十篇甩到你脸上——对，是清单，每一项都打好了勾，然后它会停下来，等你。

这是我最较劲的设计，也是我对“自主”两个字的吐槽。太多代理号称自主，其实是替你偷偷作主，完了你才发现它选的跟你想要的差很远。文献检索尤其不能这么干。排名模型聪明，但没开天眼——标题跟查询对上，正文却南辕北辙的论文，它照样打高分。所以Thessori的流程非得在半路截停不可：十篇备选，你可以挨个取消勾选。把不该留的踢掉，它才继续往下走，拉下PDF、细读、给每篇写结构化摘要，再整出一份跨文献的研究缺口分析。

看起来是模型在干活，真折腾的是脚手架。Qwen让干啥就干啥，可靠是真的，但要让这个可靠可重复，得费心安排三个环节。

一、查询不一定是你写的那样。悄悄改你的问题再搜，哪怕搜得更准，也像bug。Thessori会把你的原始措辞留下，同时给你看它悄咪咪扩展出的三个更学术的查询——比如“attention layers from google”变成“transformer self-attention mechanism”、“scaled dot-product attention”这类。有复选框，不想让它动脑子就别勾。至少，它没把背后的小动作藏起来。

二、搜索你得看见两端。arXiv和Semantic Scholar齐发，结果合并按标题去重，再一股脑丢给Qwen。Qwen只吐出最相关十篇的索引，比如[3, 0, 7, 12, ...]，代理就照着切出清单。然后就到了上面说的暂停点，人不确认，后头阅读和合成一概不开始。

三、合成不是堆砌。读完每篇PDF它会写结构化摘要，但更在意的是一组文献合起来缺什么。这个缺口分析才是综述的魂儿。结束后你能追问它刚写的东西，或让它顺着某个发现的线索继续挖。

说实话，模型反而不是主角。Thessori跑下来，最打脸的一个领悟是：把代理变成可靠研究员，用的不是更好的提示，而是让人在关键节点上“在场”。如果哪天你用它写完综述，再点根烟问它“还有啥漏掉的吗”，希望它给你的不是自信的废话，而是一篇你差点错过的重要论文。