几位研究人员对过去50年的科学进步进行了广泛的观察,得出了令人不安的结论:科学生产力正在下降。尽管放缓有各种因素,但其中之一是,随着研究变得更加复杂和专业化,科学家必须花更多的时间审查出版物、设计复杂的实验和分析数据。如今需要更多的时间、更多的资金和更大的团队来做到曾经更快、更便宜的科学发现。
现在,公益资助的研究实验室FutureHouse正在寻求通过一个人工智能平台来加速科学研究,该平台旨在自动化科学进步道路上的许多关键步骤。该平台由一系列专门用于信息检索、信息合成、化学合成设计和数据分析等任务的人工智能代理组成。
FutureHouse的创始人Sam Rodriques博士和Andrew White认为,通过让每个科学家都能接触到他们的人工智能代理,他们可以突破科学中最大的瓶颈,帮助解决人类一些最紧迫的问题。
Rodriques说:“自然语言是科学的真正语言。”“其他人正在为生物学构建基础模型,机器学习模型使用DNA或蛋白质的语言,这很强大。但发现并不能用DNA或蛋白质来表示。我们知道如何表示发现、假设和推理的唯一方法是使用自然语言。”
发现大问题
在麻省理工学院的博士研究中,Rodriques试图在Ed Boyden教授的实验室中了解大脑的内部运作。
Rodriques解释说:“FutureHouse背后的整个想法都受到了我在麻省理工学院攻读博士学位期间的一种印象的启发,即即使我们拥有了解大脑如何工作所需的所有信息,我们也不会知道,因为没有人有时间阅读所有的文献。”“即使他们能全部阅读,他们也无法将其整合成一个全面的理论。这是FutureHouse难题的基础部分。”
Rodriques在2019年的博士论文的最后一章中写到了对新型大型研究合作的需求,尽管毕业后他花了一些时间在伦敦的弗朗西斯·克里克研究所经营一个实验室,但他发现自己被在科学中没有一个实验室能够解决的广泛问题所吸引。
Rodriques说:“我感兴趣的是如何实现科学自动化或扩大科学规模,以及什么样的新组织结构或技术将释放更高的科学生产力。”
当Chat GPT 3.5于2022年11月发布时,Rodriques看到了一条通往更强大的模型的道路,这些模型可以自己产生科学见解。大约在那段时间,他还遇到了罗切斯特大学的计算化学家Andrew White,他被授予了早期访问Chat GPT 4的权限。White已经为科学建立了第一个大型语言代理,研究人员联手创办了FutureHouse。
创始人最初希望为文献搜索、数据分析和假设生成等任务创建独特的人工智能工具。他们从数据收集开始,最终于2024年9月发布了PaperQA,Rodriques称之为世界上检索和总结科学文献信息的最佳人工智能代理。大约在同一时间,他们发布了Has Anyone,这是一个让科学家确定是否有人进行了特定实验或探索了特定假设的工具。
Rodriques回忆道:“我们只是坐在那里问,‘作为科学家,我们一直在问什么样的问题?’”
当FutureHouse于今年5月1日正式推出其平台时,它重新命名了一些工具。Paper QA现在是Crow,Has Anyone现在被称为Owl。Falcon是一个能够编译和审查比Crow更多来源的代理。另一种新的产品Phoenix可以使用专门的工具来帮助研究人员计划化学实验。Finch是一个旨在自动化生物学中数据驱动发现的代理。
5月20日,该公司展示了一个多智能体科学发现工作流程,以自动化科学过程的关键步骤,并确定一种新的治疗候选药物,用于治疗干燥性年龄相关性黄斑变性(dAMD),这是全球不可逆失明的主要原因。6月,FutureHouse发布了ether0,这是一个24B开放权重的化学推理模型。
Rodriques说:“必须把这些代理看作是一个更大系统的一部分。”“很快,文献搜索代理将与数据分析代理、假设生成代理、实验规划代理集成,它们都将被设计为无缝协作。”
每个人的代理
如今,任何人都可以在platform.FutureHouse.org上访问FutureHouse的代理。该公司平台的推出在业界引起了轰动,科学家们开始使用代理来加速研究。
FutureHouse的一位科学家利用这些药物鉴定了一种可能与多囊卵巢综合征相关的基因,并提出了该疾病的新治疗假说。美国劳伦斯伯克利国家实验室的另一位研究人员使用Crow创建了一个人工智能助手,能够在PubMed研究数据库中搜索与阿尔茨海默病相关的信息。
另一家研究机构的科学家利用这些药物对与帕金森病相关的基因进行了系统评价,发现FutureHouse的药物比普通药物表现更好。
Rodriques说,那些认为这些代理不太像谷歌学者,而更像智能助理科学家的科学家,可以充分利用这个平台。
Rodriques解释说:“那些寻求猜测的人往往能从Chat GPT o3深度研究中获得更多收益,而那些寻求真正忠实的文献综述的人往往会从我们的代理那里获得更多收益。”
Rodriques还认为,FutureHouse很快就会达到这样一个地步,即其代理可以使用研究论文中的原始数据来测试其结果的可重复性并验证结论。
从长远来看,为了保持科学进步,FutureHouse正在努力将隐性知识嵌入其代理中,以便能够进行更复杂的分析,同时使代理能够使用计算工具探索假设。
Rodriques说:“围绕科学的基础模型以及蛋白质和DNA的语言模型已经取得了如此多的进展,我们现在需要让我们的代理访问这些模型以及人们通常用于进行科学研究的所有其他工具。”“建立基础设施,使代理能够使用更专业的科学工具,这将是至关重要的。”
NVIDIA DLI 与Ai时代前沿合作,将大门向更多普通用户敞开!无论你是对新技术充满好奇心的爱好者,还是希望提升自己技能的职场人士,这里都有适合你的课程和资源。
热门跟贴