打开网易新闻 查看精彩图片

新智元报道

编辑:静音 桃子

【新智元导读】在圣诞马拉松的第一天,OpenAI震撼发布了满血版o1,它凭借超凡的数学、科学和编程能力迅速引起了全球关注。最近,世界顶尖免疫学家Derya Unutmaz与o1 pro合作,让它帮忙评析自己的论文,发现它反馈的深度远超预期,令他感到震撼。此外,o1 pro还在解决人文研究问题上展现了卓越的能力。

圣诞马拉松的第一天,OpenAI对外发布了o1 pro。

近乎全网都震惊于o1 pro高达博士水平的数学、科学、编程能力。

最近,OpenAI总裁Greg Brockman在X上转发了世界顶尖免疫学专家Derya Unutmaz的帖子。

这位专家分享了他与o1 pro的一次合作经历,他让o1 pro批判性地评估了自己和学生写的一篇关于一种特定免疫细胞——粘膜相关不变T细胞(MAIT细胞)及其在癌症中作用的综述文章。

让他感到震惊的是,o1 pro在这个领域的洞察比他还要深刻——Derya是全球为数不多的顶尖专家之一,曾做出过一些关键性发现。

他还提到,虽然他曾测试过o1和Gemini Advanced模型,它们也都非常优秀,但与o1 pro相比,还是差了一截。

Greg转发了这条长帖,并说道:「推理型AI提供了有价值的反馈和洞察,帮助全球专家解决科学问题,并有潜力改善每个人的生活质量。」

打开网易新闻 查看精彩图片

除了搞数理化很厉害,o1 pro的人文社科能力也不差。

OpenAI营销研究员Kay Sorin亲自演示了o1 pro处理人文研究的能力,其效果远超4o或o1。

打开网易新闻 查看精彩图片

o1 pro震惊免疫学专家

世界顶尖免疫学专家Derya Unutmaz将他和他学生撰写的、关于黏膜相关恒定T(MAIT)细胞及其在癌症中的作用的综述文章发给o1 pro,并请它进行批判性的评估。

打开网易新闻 查看精彩图片

论文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC10965779/

在看到结果之后,Derya被o1 pro的反馈深深震撼,认为它的洞察力比自己还要深刻。

这个说法可不简单,毕竟他本人不仅是这个领域为数不多的顶尖专家之一,而且还作出过一些关键性的发现。

打开网易新闻 查看精彩图片

Derya谈道:「当我阅读它的反馈时,我发现自己盯着电脑屏幕,目不转睛,心中充满了混合的情感:难以置信、敬畏、喜悦和深深的谦逊。它提出的每一个观点,每一个问题,所有的一切都异常深刻!」

他惊叹道,若o3还更为出色,那将意味着什么?生物学的进步将比他想象中的更为迅猛。Derya进一步指出,他曾测试过o1和Gemini Advanced,这些模型也都非常优秀,但与o1 pro相比,根本无法达到这种深度的洞察力。

「o1-pro is so special! 」

以下是o1 pro读完文章后给出的反馈建议。当然了,据Derya所说,大概只有少数具备丰富免疫学知识的人才能完全理解o1 pro批评建议的精彩。

打开网易新闻 查看精彩图片

o1 pro从多个维度对综述文章进行了批判性评估。

首先,o1 pro指出文章涉及的主题范围过广,虽然涵盖了MAIT细胞的基本生物学、在传染病中的作用以及在癌症中的双重效应等,但在每个方面的探讨深度不够。

例如,关于肿瘤中MAIT细胞衰竭的部分提到了表面标记和表型,但并未深入探讨导致MAIT细胞衰竭的分子途径、信号事件或表观遗传机制。 另外,文章提到MAIT细胞具有治疗潜力,特别是在CAR-MAIT细胞和iPSC来源的MAIT细胞形式下,但未充分讨论转化性障碍——如制造可扩展性、体内持久性以及早期临床试验中的安全性问题。

接着,o1 pro指出文章在结构与概念清晰度上也有提升空间。

文章反复提到MAIT细胞的双重性质——既能促进又能抑制肿瘤进展。虽然提供了多个例子,但叙述可以通过更结构化的框架加以完善,比如用一个概念模型或决策树图来解释MAIT细胞在何时、为何展现出对立的功能。 此外,关于肿瘤异质性的问题,虽然文章提到了MAIT细胞在不同肿瘤类型中的作用差异,但并未进行系统比较,这一部分可以通过更清晰的比较分析受益。

在很多细节方面,o1 pro指出,这篇综述文章也没有探讨清楚。

其中提到MAIT细胞响应微生物代谢物并可能在肿瘤微环境(TME)中衰竭,但未深入探讨调控其分化、衰竭或细胞毒性的信号通路、转录因子和代谢线索。 以及频繁提到了MR1在肿瘤识别中的作用,却并未深入探讨为何MR1在某些肿瘤中上调,MR1的表达如何与肿瘤进展相关,或在癌细胞与正常细胞中控制MR1的调控通路。 还有,文章列举了各种细胞因子对肿瘤微环境的影响,但未深入讨论这些细胞因子与特定临床结果或癌症进展阶段的具体关联。 对于MAIT细胞在不同癌症中的相互矛盾的预后数据,文里也没有提供批判性的视角来调和这些矛盾。 另外,尽管提到微生物组在塑造MAIT细胞功能中的作用,却未具体说明哪些微生物物种或代谢物与肿瘤调节密切相关,或如何通过调控微生物组来改善MAIT细胞。

对于两种MAIT细胞治疗策略(CAR-MAIT细胞治疗和iPSC来源的MAIT细胞治疗)的探讨,o1 pro也给到了相应的建议。

CAR-MAIT细胞治疗部分可以通过讨论安全性问题(如脱靶效应、长期持久性和新型免疫病理)以及借鉴CAR-T治疗的经验教训(如细胞因子释放综合症和神经毒性)来改进。 而iPSC来源的MAIT细胞虽然创新,但文章中未充分评估其局限性,如未完全重现原生MAIT细胞库、重编程过程中的潜在基因组变化,以及在临床规模上生产这些细胞的难度。

o1 pro还讨论了综述文章在方法学方面的不足,具体涉及文献选择方法和人类与动物模型的比较。

文章缺乏系统性文献选择方法,可能引入偏差,且未对研究文献的筛选标准进行解释,影响可信度。 同时,文章未讨论MAIT细胞在不同物种(如人类与小鼠)之间的生物学差异,可能会限制了读者关注人类治疗时的转化意义。

最后,o1 pro强调,尽管文章在结论中提到需要更多研究,但缺乏具体的方向性建议。

例如,作者可以提出关键实验或突出显示紧迫的临床试验,这些研究将澄清MAIT细胞在癌症免疫治疗中的作用,或详细说明应优先开发哪些分子靶点(例如MR1或相关信号通路)。

o1 pro还能搞人文研究

在人文研究方面,o1 pro也有了大显身手的机会。

打开网易新闻 查看精彩图片

Kay Sorin的这位朋友是著名出版社的记者,但一直以来非常抗拒AI为工作提供帮助的建议。

目前,他在撰写一本需要复杂历史研究的传记时,遇到了一个困难——

无法从资料中,找出名为Jonathan这位默默无闻作家的姓氏。而且,这些文件没有任何识别信息,更像是感谢信和便条之类的东西。

由此,Kay Sorin决定尝试为其提供帮助。

她上传了4张图片给到GPT-4o,并问道「这位Jonathan在1980年代是《纽约书评》的作家和知识分子。他的姓是什么」?

GPT-4o思考了52秒,给出回答:

抱歉,我在这些信件或图片中没有看到任何能够透露Jonathan姓氏的信息。这里展示的摘录和笔记从未提到过他的姓氏,所以我没有足够的信息来确定他是谁。

接下来,她又将同样提示扔给o1 pro,在思考了1分57秒后,它找得到了全名「Jonathan Lieberson」。

Kay Sorin朋友对此感到非常惊讶,并再次问o1 pro,「你是找到更多关于Jonathan的消息来源」?

o1 pro给出了几段解释,并提出了连记者本人都没有想到的建议。

打开网易新闻 查看精彩图片

o1 pro在STEM领域中的表现,已经屡见不鲜,这也是它在人文领域很好的证明。

参考资料:

https://x.com/gdb/status/1870894179846590790

https://x.com/kaysorin/status/1871264540698239050

打开网易新闻 查看精彩图片