从证明“为什么”到探索“怎么做”。
作者 /Oriana
推开AI+材料的门
在美国的实验室里推翻了一条存在四十年的物理定律后,南凯并没有感到预想中的狂喜,反而被一种巨大的空白感笼罩。
那是他博士生涯的第四年,两篇登上了物理学顶刊PRL*的论文,耗尽了此前所有的踌躇满志。面对屏幕上的公式,他意识到,纯粹解释世界为何如此,似乎已不是故事的终点。一个念头变得清晰:他想知道如何让世界变得不同。
*《物理评论快报》:全球物理学界被引用次数最多的期刊,发表过约20篇后来获诺贝尔奖的研究。
回到起点。
南凯的本科在天津大学一个实验班里,学校把精密仪器领域多个专业的核心课程全部打包。前三年,他在激光光学、硬件测控、固体物理和生物医学仪器之间来回穿梭。
“模式有点像美国那种通识教育,”他回忆道,“对于刚成年、对世界不了解的人来说,是个很好的窗口,你有机会自己去了解到底要学什么,而不是只听别人说。”于是,他怀着一种“比较崇高的想法”选择了生物医学工程,渴望做些有意义的事。
大四赴美交换,他沉浸于构建光学系统来无损伤探测人体组织。2016年正值人工智能的浪潮初涌,还没有现成的大数据集。他需要从几万张医学图像中,亲手构建数据集、为算法寻找规律。这段经历让他体验到了用新工具解决老问题的愉悦。
正是这种愉悦,让原本无意学术的他,在错过博士申请季后,毅然决定Gap一年,然后奔赴南佛罗里达大学攻读物理博士。“有自己的公寓,有奖学金,能安心做想做的事,”他笑着形容,“简直就是人间天堂。”
天堂里亦有炼狱。
南凯选择了凝聚态物理中一个名为“软物质”的艰深角落,并直接瞄准了一个目标:挑战一项被学界默认了四十年的经典理论。
接下来的三年,是日复一日的不确定。早晨醒来先在房间里思索今天的方向,然后钻进实验室,直至夜色深沉。没有社交媒体的热闹分享,少有同行间的即时讨论,物理领域的探索常是寂静而孤独的。
“第一年你踌躇满志,第二年你信心满满,第三年已经有点心灰意冷。”南凯平淡地描述那种状态。
终于在读博的最后一年厚积薄发,他以两篇论文、三个新公式完成了这场艰难的长跑——推翻了由美国物理学家E. J. Kramer等人建立的经典银纹理论预测,证明曾被认定必然脆性的半刚性聚合物玻璃可以具备延展性,为设计新型高韧性柔性电子材料打开了新思路。
然而,胜利的滋味是复杂的,长久的自我较劲让他感到“半条命没了”,也让他对这种纯粹的理论探索产生了些许倦意。
他需要新的坐标:先是在字节跳动一个类似“Google X”的前沿团队里实习,用AI模型解析基因序列;毕业后又加入一家初创公司,用图像和算法模拟药物在人体内的释放过程。这两段经历将他从理论的空中楼阁,拉进了产业的实际需求。
他看到了AI在生物医药领域已成体系的规则,也敏锐地察觉到一个巨大的反差:在他深耕的材料科学领域,AI的应用少得可怜。
在一次国际会议上,他直接向华裔院士Andrea Liu发问:“为什么我们这个领域用AI这么少?”对方的回答印证了他的观察:拥抱程度低,即便顶尖课题组,也只有零星尝试。
他想填上这块空白。但创业不是写论文,得找个能落地的口子。直到遇见后来的合伙人,一个在半导体材料里泡了十多年的人。一个懂算法,一个懂产线,模糊的想法终于有了形状:就从半导体封装材料切进去,用AI重写材料研发的老规矩。
如今,南凯创立的公司“SynMatAI(新研智材)”刚满一岁,团队只有十余人。他们一边搭建算法平台,目标是将传统需要上千次的实验,压缩到几十次内;另一边,他们亲自研发具体的半导体材料,最快将于明年送样。
就在今天,SynMatAI发布了最新的Agent“SynMatAgent”,它集成了全部算法工具与能力的智能研发中心,能直接生成可执行的详细实验方案以显著缩短研发周期,并通过持续反馈进行自我优化。
南凯还大方聊起外界对“AI+材料”领域是否足够原创、实用且精确的的质疑。他理解这种落差:工业界要的是一份能直接投产的配方,而前沿算法给出的往往还是一个遥远的答案。他清楚,这中间的鸿沟,正是他们这类公司的机会与价值所在。
至于商业模式,他想得很透:卖软件或专利在材料领域很难走通,真正的路径是亲自下场,成为一家用AI驱动研发的新材料公司。
以下是新物种与SynMatAI CTO南凯的对谈,欢迎进入一段从证明“为什么”到探索“怎么办”的故事。
01.泅渡深水区
新物种:你在南佛罗里达大学攻读物理博士时具体研究什么?哪些paper或项目让你印象最深刻?
南凯:我研究的领域偏机理,中文叫“软物质(Soft Matter)”,属于凝聚态物理下的一个分支,主要研究这类材料和物质背后的现象与原理。
博士五年,我在顶刊PRL(物理评论快报)上发表了两篇文章,印象很深。因为前三年几乎颗粒无收,只发了一篇二作,直到第三、四年才完成这两篇。整个过程非常漫长,也很折磨人。很多时候觉得做不出来了,不明白为什么理论和现象对不上。后来仿真成功了,又要去解释它背后的原因。
这两篇文章提出了三个新公式,像定理一样,推翻了之前的某些理解。那段时间挺难的,有过很多个心灰意冷的时刻。
新物种:为什么这么难?是因为目标定的太大了吗?
南凯:确实选了个高难度的起点。其中一篇PRL论文,挑战的是一个存在了40年的定律——由美国物理学家Kramers提出的理论。一个被学界默认正确的理论,你要去推翻它,这本身就决定了项目的艰难。另一篇则完全是在黑暗中摸索,毫无方向可言。
这和个人追求也有关。有些同学可能会选择先在普通期刊上发表文章,把数量积累起来。但我更想做些有价值、有创新的研究。
那段时间,每天七八点自然醒来,先发呆思考今天要怎么办,然后去实验室一直工作到傍晚。晚上看文献到11点,打会儿游戏,12点睡觉,很折磨。最大的痛苦在于不确定自己探索的东西究竟有没有答案。尤其是第二篇PRL,导师也不太确定方向,基本靠我自己摸索。这种状态下,第一年踌躇满志,第二年信心满满,到了第三年,就有点心灰意冷了。
论文链接:
https://link.aps.org/accepted/10.1103/PhysRevLett.129.127801;https://link.aps.org/accepted/10.1103/PhysRevLett.130.166102
新物种:到后面你也开始往产业界探索了,为什么会去字节实习?
南凯:我所在的组类似Google X的跨学科小团队,隶属于战略部,当时成立不到一年,才十来个人,既要做前沿的生物项目孵化,也要做行业研究,可能还会参与投资评估。我觉得这种混合模式很有意思,能接触不同背景的人,就决定加入。
团队主要聚焦三个方向:大分子、小分子和核酸。我选了核酸,具体是用BERT模型预测mRNA的序列结构(也就是碱基排列),然后再通过模拟来评估这些结构的稳定性。简单说,就是两步:生成序列,然后验证它稳不稳定。
新物种:那你毕业后没想过做AP(助理教授)吗?为什么会选DigiM这个偏医药的offer?
南凯:我纠结了很久。其实我之前没想过做教授,因为对我而言这种生活有些一成不变。虽然发了文章后也拿到了博后邀请,但最终还是决定彻底换个环境。很大程度上是因为写那两篇PRL的过程太折磨了,我不想再重复那种压抑。
后来选择加入DigiM,是因为他们做的东西很特别。当时很多AI医药都集中在药物发现早期,比如找靶点或设计分子。但DigiM关注的是偏后期的问题:一个已经做出来的药,在人体内需要多久释放、多久吸收?他们用AI分析药物的微观图像,再结合流体力学等物理规律来模拟整个过程,这能大幅减少真实的生物实验。
我觉得这是一个被大多数人忽略、但又很有前景的方向。如果我要花十年时间做一件事,我希望它足够新颖,能让我在十年后回想起来依然觉得值得。这份工作给了我这种感觉。
02.时机到了
新物种:感觉你还是挺想在这长期发展的,那为什么在DigiM工作不久后,就选择回国创业?
南凯:其实从字节实习开始,我就一直想做“AI+”的交叉方向。我的学术背景是研究物质机理,本质上更贴近材料。但在参加学术会议时,我发现我们这个领域和AI的结合非常少。
有一次我和领域里的大牛、美国院士Andrea Liu交流,我直接问她为什么我们这里用AI这么少?她说,整个领域对这个的拥抱程度确实不高,她的实验室很大,但也只有一小部分人在做相关尝试。
这让我感触很深。在生物领域,AI已经发展了二十多年,形成了一套成熟的玩法。但在材料这里,几乎还是个空白。我一直想填补这个空白,但不知道从哪里切入。创业不是做学术课题,必须找到能落地的具体问题。如果只做研究,那我不如去当教授自己搞实验室。
转机出现在我遇到现在的合伙人、我们的CEO。我们是在一次会议上认识的。他在半导体材料产业有多年经验,而我偏算法背景。这样,一个懂产业和工艺,一个懂算法和模型,刚好互补。我们聊起这个想法,都觉得时机到了,找到了从半导体封装材料切入的具体路径,这才决定回来创业。
新物种:时机成熟主要有哪些具体条件?
南凯:主要是三个层面都准备好了。
第一是算力,AI for Science 用的算法通常不是最前沿的,现有的算力已经足够。第二是算法本身,经过这些年的发展,AI的框架和开源工具已经很成熟了。第三是数据,材料领域发展多年,有了一定的积累。
这三者结合,到了比较好的切入点。虽然材料和生物很不一样,但我们可以参考 AI for Biotech 领域的发展路径,学习如何将AI应用到一个传统学科里。
新物种:那你当时为什么选择做CTO,而不是CEO?
南凯:我很认同的一个观点是,开公司最大的困难是管人,而不是技术。我现在还不擅长统筹管理或把握公司整体方向。
做To B的产业化落地,需要对行业有很深的积累,比如供应链、制造这些非常复杂的事情。如果没有相关背景或资源,一个人很难完成。作为CTO,我可以专注在技术上,同时也能在这个过程中学习。
新物种:明白,还请用一句话通俗介绍SynMatAI是做什么的。
南凯:我们希望通过AI来替代部分材料研发工作。具体来说,是让AI像工程师一样,完成从研发、生产到量产的整个流程。
新物种:现阶段主要辅助哪个环节?
南凯:目前各个环节都能辅助。我举个例子:假设研发一款材料需要做1000次实验,有经验的工程师可能要做200次,而我们的AI目标是将实验次数降到20次。这个辅助作用贯穿小试、中试和客户适配全阶段。
材料研发周期长,就是因为这三个阶段都得反复调整,就像做饭——在家做两人份和给食堂做一百人份,调料比例不是简单放大;菜馆开在广东还是四川,辣度也要调整。
我们的AI能在每个阶段,都把最有可能成功的方案筛选给工程师,省去大量试错。工程师每做一次实验,数据反馈给AI,AI的下次预测就会更准,形成一个不断优化的循环。
新物种:那你们是自研模型吗?还是基于大模型微调的吗?
南凯:我们有很多模型,包括大模型和小模型。有些是基于通用模型用材料数据微调的,但更多是专门为不同任务自研的。材料研发变量太多,一个模型不够用,需要多个模型协同工作。
比如,我们有专注于结构和性能映射的“EvoNet”,也有基于物理机理的模拟仿真模型“EvoSim”。机理模型给出理论理想值,AI模型给出预测值,两者相互参照,共同得出更接近实际的结果。
新物种:你们专注于哪类材料?比如高分子?
南凯:我们目前主要聚焦在半导体相关材料。
新物种:未来会一直专注半导体材料,还是会涉及其他类型的材料,做更通用的平台?
南凯:从长远愿景看,比如以50年为目标,我们当然希望做成一个通用的平台。但务实地说,必须先在半导体材料这个垂直领域做深、形成商业闭环,有了成功案例后才能向外扩展。这就像造机器人,不能一上来就让它什么都会,得从跳舞、抓取等具体技能一步步做起。
03.弯道超车
新物种:创业这一年间,你们遇到的最大困难或意外是什么?
南凯:首先因为我们正在同时推进的商业模式有两块:一是提供软件去卖私有化部署和扮演CRO的角色去共同研发某个材料,二是自己下场研发材料。
真正对接产业时才发现两大困难。一是很多材料公司对AI的理解非常有限;二是整个产业链的复杂程度超乎想象,很多环节的电子化程度极低。
比如,很多公司至今仍靠手写记录实验过程和结果。好些的用Excel,但那只是个文件,不是结构化的数据库。这些是以前根本想不到的细节,都成了实实在在的障碍。
新物种:那针对材料研发和算法优化的业务,如何判断成功率?有无具体案例?
南凯:我们主要通过实际实验来验证算法的成功率,这是衡量技术是否work的核心。与此同时,我们投入的重点是自研新材料,用自己的算法平台推动实际研发。
一个最直接的案例就是我们自研的半导体材料进展很快。公司2024年底成立,预计明年就能送样测试,这个速度本身就是对技术有效性的一个证明。
新物种:你觉得AI+材料的商业闭环打通了吗?没有的话,可能的模式是什么?
南凯:现在还没有打通。比如一些公司,主要客户还是高校和研究所,这不算成熟的商业模式。
参考AI+生物医药,目前有几条路:卖IP(卖专利)、卖软件、或者自己研发药物。其中自己研发的模式相对最成功。
但材料领域很不一样。第一,高质量公开数据很少;第二,材料缺乏像医药那样严格的专利保护和审批监管,一个配方被知道后,别人稍作调整就能做出中低端产品,所以“卖IP”很难成立。至于“卖软件”,因为缺乏数据,软件效果有限,而想用客户数据优化,客户又不可能提供自己的核心商业秘密。
所以走下来,可能只有一条路:自己下场做材料,成为AI驱动的新材料公司。目前整个行业还没有完全跑通的先例,但我们的商业逻辑就是以软件为辅,以自己研发材料为主,我们认为这条路是可行的。
新物种:你们如何解决材料领域内高质量数据稀缺的问题?
南凯:我们现在是从几个方面获取数据:一是我们创始团队过去积累的私有实验数据;二是正在自建的无人实验室,用于验证并产生新数据;三是更关键的,我们从领域专家那里提取和结构化“Know-How”。
仅有实验数据往往只能解决特定问题,结合了Know-How的数据才能提升模型的泛化能力。我们也会使用仿真数据,但它主要提供理论或理想上的参考值。
新物种:作为初创公司CTO,你如何看待与DeepMind、微软等大厂以及传统材料公司的关系?
南凯:像DeepMind、微软,它们的研究偏向前沿探索,离实际应用比较远。而像3M、三星这样的大公司内部研究院,虽然也在做,但往往有“大公司病”,进展并不顺利。
我觉得,如果一个领域没有很多人投入,反而说明它可能没有潜力。玩家越多,才证明赛道越有活力。
对于初创公司来说,我们的优势在于灵活,没有大公司的管理包袱。同时,AI技术本身也给初创公司带来了弯道超车的机会。当你有深厚的行业知识(Know-How)时,AI能帮助你更快实现突破。
新物种:具体来看,初创公司的机会在哪些环节?
南凯:机会是全面的。这又回到了刚才说的商业模式。
如果做软件,初创公司反而有优势。想象一下,如果3M推出一款材料研发软件,它的竞争对手杜邦、汉高肯定不会买。但作为独立的初创公司,就没有这个问题。
如果自己做材料,初创公司的优势在于专注和灵活。可以集中所有资源,专攻某一个高端材料品类。利用AI能力,一些用传统方法极难研发的材料,可能会被更快地做出来。
新物种:那对比中美呢?在大模型领域,中美差距现在可能缩小到了3个月。你认为在AI+材料领域的差距是多少?
南凯:我了解的情况是差距不大甚至有优势。这又回到了刚才的话题:材料最终要落实到生产,而产能基本都在中国,这会带来数据获取上的优势。
除了数据层面有优势,至于算法,现在国内大模型也很强,差距不明显。AI for Science通常不需要最前沿的算法,所以算法差距更小。
比如说美国有家做超导材料的明星初创公司,估值很高。但我们是做半导体的,两者方向不同,很难直接比较谁更先进。整体上,我不觉得美国有显著领先,我们在数据上反而有优势。
04. 非标的实验科学
新物种:无论是具身智能还是Agent,都有过被评价为泡沫的质疑,AI+材料也存在类似的情况吗?你认为AI会彻底重塑材料科学吗?
南凯:AI+材料现在还很新,从工业角度没几年,所以不好下结论判断泡沫。但我认为AI肯定会改变这个领域。材料科学的核心挑战在于它是一个实验科学,变量太多,不得不依赖大量试错。
如果未来AI足够强大,能够获取并理解海量、多类型且有权重差异的数据(不仅仅是做数值拟合),那么它就有可能减少对这种试错的依赖。这里的关键是,必须是“科学领导AI” ,要让AI理解数据背后的物理含义,而不是反过来。当AI能真正理解物理世界,并拥有足够参数时,它就一定能重塑这个领域。
新物种:今年国际上有不少AI发现材料的重磅新闻,但也伴随很多争议。比如微软MatterGen登上自然杂志,却被一些科学家批评原创性、实用性不足。你从产业一线看,怎么看待这种质疑与落差?
南凯:材料领域的成果不那么直观可见。有些领域如机器人可以现场演示动作,而AI生成的材料,你只能展示一个结果或者说“我们做出来了”,整个漫长的研发过程很难被直接感知。
此外,材料是实验科学,必须到能落地。像MatterGen这类基于模拟和AI的预测,和实际实验的结果可能存在差距,这自然会引发重视实验的科学家的质疑。
所以,这些争议部分源于过高的期待——产业界希望AI能直接给出可用的完美方案,但前沿研究和实际应用之间还有鸿沟。同时,AI+材料关注度相对较低,一是因为研发反馈周期长,成果见效慢;二是因为“AI for Science”这个概念本身太宽泛,下面包含了生物、材料等众多差异巨大的子领域。
新物种:那材料领域有像AlphaFold那样开源的里程碑模型吗?
南凯:像MatterGen也开源了,但很难说它是材料界的“AlphaFold”。核心差异在于,AlphaFold预测的蛋白质结构本身就是一个极具价值的终点。
而在材料领域,即使预测出了所有的晶体结构,也远未结束,因为最关键的一步是真的在实验中把它做出来。预测出的结构可能非常难以合成或实现。所以,材料科学的实验属性,决定了很难出现一个像AlphaFold那样具有轰动性、决定性意义的单一工具。
新物种:那对材料领域来说,什么才是像结构之于蛋白质的那个关键因素?
南凯:这很难简单类比,材料科学本身的范围就极其广泛,下面分支众多。当你具体到要解决什么case时,面前已经存在着无数种不同的材料类型和问题了。这也是这个领域门槛高、难以普及的原因之一。
制药的目标相对统一(做出可用的药),且后期流程标准化。而材料研发的每个阶段(小试、中试、客户适配)都可能长达数年,且需要大量非标准的调整。此外,现实中应用的多是复合材料,如何协调多种材料之间的关系是更大的难题。
因此,如果问产业界的一线工程师最想要什么,那可能不是某个结构数据库,而是一个能直接告诉他“这个材料具体该怎么一步步做实验”的解决方案。
新物种:最后一个问题。你们团队对SynMatAI的长期期待是什么?比如五年或十年后,希望成为一家怎样的公司?
南凯:我们期待AI能真正在材料领域发挥实际作用——它应该能极大地节省人力、释放劳动力,或者说创造显著的生产力。我们希望AI能切实带来这样的改变。
排版运营 /Teagan
- End -
热门跟贴