葛存菁这个名字,最近有点刷屏了。

有人说他是葛军的孩子,葛军这个名字在竞赛圈几乎是传奇——他带过多少届省队,我不太清楚,不确定,但至少业内人都认得这位大佬。

葛存菁是不是葛军的儿子,我查了一圈公开资料,发现这种说法挺多,但官方并没有直接证实。

如果真的是亲子关系,那高一拿全国数学竞赛一等奖、后来又一路读到中国科大本科、中科院博士、再到南京大学人工智能学院任教,这条路也算是竞赛状元发展里的经典路线,只不过能做到的人实在少。

打开网易新闻 查看精彩图片

——你会觉得是不是家里环境、个人天赋、以及资源三者缺一不可?

他现在做的是数量逻辑、符号学方面的科研,说实话,这些听起来像上世纪八九十年代AI刚起步时那些先想清楚再做实验的学派。其实这个方向和当前流行的深度学不太一样。

多数人讲AI,想到的是大模型、算力、数据一把抓,他却搞抽象推理、模型可解释的东西。讲个比喻,这就像大多数人靠死记硬背题海战术取胜考试,他尝试设计一个能理解规则、自己推断答案的聪明考试机器人。

你觉得这种研究路线,是不是有点像逆流而上的怪咖?——尤其在大家都在晒GPT成绩、数据刷新纪录的时候。

我之前在实验室见过类似的课题。印象中,符号学的东西容易卡在实际应用环节。工程师在休息室抱怨过:符号模型写出来都很美,但到产品落地遇到真实场景,数据杂乱、规则不纯,都得重新理一遍。他们那会儿用的还是混合架构,底层算力分配很麻烦。

我刚查了当时记录,发现符号推理消耗的计算资源,实际远低于深度神经网路——大约只需要GPU百分之十几的算力(粗略估算,样本有限)。但在复杂场景下,工程师反倒倾向于用数据驱动的方法。你感觉这是不是说明,理论派最终也要妥协于实际?

打开网易新闻 查看精彩图片

(这个话题我们稍后再说)

说到家学渊源,你会忍不住想问,葛军是不是把竞赛全部技巧都塞给了孩子?其实我被家长朋友问过类似问题:竞赛里这些孩子,是不是全靠家庭辅导?还是自学能力更强?我的体感是,家庭环境能帮助孩子识别和抓住机会,但真正冲到顶尖,还是个人努力和兴趣主导。

参考数据,近年来全国高数竞赛一等奖(不是全国金牌,只是省级一等奖)一年也就发给几百个人——我没细查2020年及以后数据,估计都在600到800人之间。偶尔有某个家庭出两位一等奖获得者,概率低到可以忽略。

再看南京大学人工智能学院现在的准聘机制。助理教授这个位置,既有教学压力,又要带团队写项目申报。前几天我碰到一位南京大学AI方向的老师,他说,现在年轻老师获批项目就像买,到手才算数,之前都得拼材料和人脉。这话扎心。

葛存菁如果真是葛军的孩子,那除了天赋,这种年年进步、层层晋级的节奏,也跟家庭推进、学术氛围有关。我有点怀疑,国内这样父子档/亲子档的顶尖科研线路是不是越来越多?没深入想过,纯粹个人猜测,可能只是信息透明度高了,大家都在关注家庭背景。

符号学实际的应用场景,说实话没想得那么远。我以前把这个方向想得很理想,被现实修正过。不是每个模型都能对接真人场景。一回开会时,工程师小刘直接吐槽:都说符号推理能解释问题,用户根本不关心。要结果,不要分析。这点我现在完全理解。

产品经理那会儿也烦,你们搞那么精细的技术,用户点击率掉下去,我就得背锅。后来我们把符号模型嵌到内容推荐里,实际提升幅度没想象中明显——粗略估算,推荐排序准确率提高不到3%,还要在大模型和符号逻辑之间不断调参。

打开网易新闻 查看精彩图片

你会不会觉得,这种研究就像一场精细工艺与生产效率的较劲?

话题拉回来,葛存菁博士毕业于中国科学院软件所。我对这个单位有些特殊感情,之前合作项目遇到的软件所工程师,做事一板一眼,但处理产品时特别细。一次测试新算法,软件所同事一边戴着眼镜调代码,一边和我说,模型参数调整一定要先跑小样本多次,别信理论预测。

那画面我现在还能回忆起,室内的白色灯光映在他电脑屏幕上,反射出额外一层花纹。其实对于任何AI实验,现场的细节、设备能耗、人力分配(临场估算我们大概有六七个人日投入,仅为验证一个参数)都比论文里的成就更接地气。

说回家庭和学术经历。你会好奇,葛存菁在奥地利做博士后期间,主要研究什么课题?我查了下公开信息,不确定详细方向,只看到他参与过一些量化逻辑自动化的项目。有同行评价,人很踏实,做事不张扬。

这种风格和国内浮躁的搞大模型、写高分论文现象形成鲜明对比——当然这个评论只是个人观点,未必全对。

有一点我会自我修正一下。前面说家庭背景对科研路线帮助很大,但要限定:不是所有家庭都能把孩子送到顶尖岗位。如果没有行业资源、学术积累,光凭家庭管教远远不够。你会不会觉得,真正冲到南京大学人工智能学院任教,除了家庭,还是要看个人在数据、模型、产品应用上的成长?

打开网易新闻 查看精彩图片

符号学这种偏冷门、深背景的技术,能不能跑出实际产品,还需要时间验证。

这一圈想下来,家庭、学术、产品现场、理论推理、现实应用,一层层叠加,有点像组装一台复杂的设备——每一步都需要调试、反馈和修正。我刚翻了测试照片,还记得那天调试模型时,大家圈在电脑前,屏幕上还挂着一行报错信息:符号推理模块未响应,重启后再试。这种场景,跟论文里的突破算法、创新理论,距离其实很远。你愿意相信,科技产品背后真正的难题,就在这些小细节上。

有时候会去想,十年后符号学会不会变成主流?现在看来,不确定,没深入想过,只能随时关注领域的新动向。房间里人声渐渐稀疏,只剩下屏幕光影和一行未解的代码。