南京大学新晋助理教授背景引热议，父亲是葛军|南京大学|学术论文|数学|符号学|葛军

葛存菁这个名字，最近有点刷屏了。

有人说他是葛军的孩子，葛军这个名字在竞赛圈几乎是传奇——他带过多少届省队，我不太清楚，不确定，但至少业内人都认得这位大佬。

葛存菁是不是葛军的儿子，我查了一圈公开资料，发现这种说法挺多，但官方并没有直接证实。

如果真的是亲子关系，那高一拿全国数学竞赛一等奖、后来又一路读到中国科大本科、中科院博士、再到南京大学人工智能学院任教，这条路也算是竞赛状元发展里的经典路线，只不过能做到的人实在少。

——你会觉得是不是家里环境、个人天赋、以及资源三者缺一不可？

他现在做的是数量逻辑、符号学方面的科研，说实话，这些听起来像上世纪八九十年代AI刚起步时那些先想清楚再做实验的学派。其实这个方向和当前流行的深度学不太一样。

多数人讲AI，想到的是大模型、算力、数据一把抓，他却搞抽象推理、模型可解释的东西。讲个比喻，这就像大多数人靠死记硬背题海战术取胜考试，他尝试设计一个能理解规则、自己推断答案的聪明考试机器人。

你觉得这种研究路线，是不是有点像逆流而上的怪咖？——尤其在大家都在晒GPT成绩、数据刷新纪录的时候。

我之前在实验室见过类似的课题。印象中，符号学的东西容易卡在实际应用环节。工程师在休息室抱怨过：符号模型写出来都很美，但到产品落地遇到真实场景，数据杂乱、规则不纯，都得重新理一遍。他们那会儿用的还是混合架构，底层算力分配很麻烦。

我刚查了当时记录，发现符号推理消耗的计算资源，实际远低于深度神经网路——大约只需要GPU百分之十几的算力（粗略估算，样本有限）。但在复杂场景下，工程师反倒倾向于用数据驱动的方法。你感觉这是不是说明，理论派最终也要妥协于实际？

（这个话题我们稍后再说）

说到家学渊源，你会忍不住想问，葛军是不是把竞赛全部技巧都塞给了孩子？其实我被家长朋友问过类似问题：竞赛里这些孩子，是不是全靠家庭辅导？还是自学能力更强？我的体感是，家庭环境能帮助孩子识别和抓住机会，但真正冲到顶尖，还是个人努力和兴趣主导。

参考数据，近年来全国高数竞赛一等奖（不是全国金牌，只是省级一等奖）一年也就发给几百个人——我没细查2020年及以后数据，估计都在600到800人之间。偶尔有某个家庭出两位一等奖获得者，概率低到可以忽略。

再看南京大学人工智能学院现在的准聘机制。助理教授这个位置，既有教学压力，又要带团队写项目申报。前几天我碰到一位南京大学AI方向的老师，他说，现在年轻老师获批项目就像买，到手才算数，之前都得拼材料和人脉。这话扎心。

葛存菁如果真是葛军的孩子，那除了天赋，这种年年进步、层层晋级的节奏，也跟家庭推进、学术氛围有关。我有点怀疑，国内这样父子档/亲子档的顶尖科研线路是不是越来越多？没深入想过，纯粹个人猜测，可能只是信息透明度高了，大家都在关注家庭背景。

符号学实际的应用场景，说实话没想得那么远。我以前把这个方向想得很理想，被现实修正过。不是每个模型都能对接真人场景。一回开会时，工程师小刘直接吐槽：都说符号推理能解释问题，用户根本不关心。要结果，不要分析。这点我现在完全理解。

产品经理那会儿也烦，你们搞那么精细的技术，用户点击率掉下去，我就得背锅。后来我们把符号模型嵌到内容推荐里，实际提升幅度没想象中明显——粗略估算，推荐排序准确率提高不到3%，还要在大模型和符号逻辑之间不断调参。

你会不会觉得，这种研究就像一场精细工艺与生产效率的较劲？

话题拉回来，葛存菁博士毕业于中国科学院软件所。我对这个单位有些特殊感情，之前合作项目遇到的软件所工程师，做事一板一眼，但处理产品时特别细。一次测试新算法，软件所同事一边戴着眼镜调代码，一边和我说，模型参数调整一定要先跑小样本多次，别信理论预测。

那画面我现在还能回忆起，室内的白色灯光映在他电脑屏幕上，反射出额外一层花纹。其实对于任何AI实验，现场的细节、设备能耗、人力分配（临场估算我们大概有六七个人日投入，仅为验证一个参数）都比论文里的成就更接地气。

说回家庭和学术经历。你会好奇，葛存菁在奥地利做博士后期间，主要研究什么课题？我查了下公开信息，不确定详细方向，只看到他参与过一些量化逻辑自动化的项目。有同行评价，人很踏实，做事不张扬。

这种风格和国内浮躁的搞大模型、写高分论文现象形成鲜明对比——当然这个评论只是个人观点，未必全对。

有一点我会自我修正一下。前面说家庭背景对科研路线帮助很大，但要限定：不是所有家庭都能把孩子送到顶尖岗位。如果没有行业资源、学术积累，光凭家庭管教远远不够。你会不会觉得，真正冲到南京大学人工智能学院任教，除了家庭，还是要看个人在数据、模型、产品应用上的成长？

符号学这种偏冷门、深背景的技术，能不能跑出实际产品，还需要时间验证。

这一圈想下来，家庭、学术、产品现场、理论推理、现实应用，一层层叠加，有点像组装一台复杂的设备——每一步都需要调试、反馈和修正。我刚翻了测试照片，还记得那天调试模型时，大家圈在电脑前，屏幕上还挂着一行报错信息：符号推理模块未响应，重启后再试。这种场景，跟论文里的突破算法、创新理论，距离其实很远。你愿意相信，科技产品背后真正的难题，就在这些小细节上。

有时候会去想，十年后符号学会不会变成主流？现在看来，不确定，没深入想过，只能随时关注领域的新动向。房间里人声渐渐稀疏，只剩下屏幕光影和一行未解的代码。