我搭了个工具,叫Thessori——让它替你整理文献综述,最后还能导出Markdown、LaTeX或PDF。不为别的,就是被那几百篇没读的论文逼急了。每个研究项目开始都一样:一个问题,一堆文献,得先筛出相关的,再读完,然后找出“没人试过的事”。前两步明明是机械活,市面上多数工具却只在读完后才帮你整理。Thessori更靠前一步,你给研究问题,它还你一份能直接拿给导师看的综述。
这段代码是为Qwen Cloud黑客松里的“自动驾驶代理”赛道写的。你别选错模型:Plus还是Max,得自己挑。输完研究问题,代理同时跑去arXiv和Semantic Scholar搜,再用Qwen对结果排个名,然后把挑出的十篇甩到你脸上——对,是清单,每一项都打好了勾,然后它会停下来,等你。
这是我最较劲的设计,也是我对“自主”两个字的吐槽。太多代理号称自主,其实是替你偷偷作主,完了你才发现它选的跟你想要的差很远。文献检索尤其不能这么干。排名模型聪明,但没开天眼——标题跟查询对上,正文却南辕北辙的论文,它照样打高分。所以Thessori的流程非得在半路截停不可:十篇备选,你可以挨个取消勾选。把不该留的踢掉,它才继续往下走,拉下PDF、细读、给每篇写结构化摘要,再整出一份跨文献的研究缺口分析。
看起来是模型在干活,真折腾的是脚手架。Qwen让干啥就干啥,可靠是真的,但要让这个可靠可重复,得费心安排三个环节。
一、查询不一定是你写的那样。悄悄改你的问题再搜,哪怕搜得更准,也像bug。Thessori会把你的原始措辞留下,同时给你看它悄咪咪扩展出的三个更学术的查询——比如“attention layers from google”变成“transformer self-attention mechanism”、“scaled dot-product attention”这类。有复选框,不想让它动脑子就别勾。至少,它没把背后的小动作藏起来。
二、搜索你得看见两端。arXiv和Semantic Scholar齐发,结果合并按标题去重,再一股脑丢给Qwen。Qwen只吐出最相关十篇的索引,比如[3, 0, 7, 12, ...],代理就照着切出清单。然后就到了上面说的暂停点,人不确认,后头阅读和合成一概不开始。
三、合成不是堆砌。读完每篇PDF它会写结构化摘要,但更在意的是一组文献合起来缺什么。这个缺口分析才是综述的魂儿。结束后你能追问它刚写的东西,或让它顺着某个发现的线索继续挖。
说实话,模型反而不是主角。Thessori跑下来,最打脸的一个领悟是:把代理变成可靠研究员,用的不是更好的提示,而是让人在关键节点上“在场”。如果哪天你用它写完综述,再点根烟问它“还有啥漏掉的吗”,希望它给你的不是自信的废话,而是一篇你差点错过的重要论文。
热门跟贴