打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

1979-1989年间,李政道、吴瑞(Ray Wu)、William von Eggers Doering和陈省身(Shiing-shen Chern)通过物理、化学、生化、数学四个中美博士生考试与申请项目(China-US PhD Examination and Application Programs, CUS-PhD-EA)选派1700余人赴美攻读博士,培养了大批顶尖人才。该系列访谈旨在通过展示这些校友在过去半个世纪中对中国乃至全球发展所做出的集体贡献,彰显这些项目不仅对中国,也对全球都具有划时代的历史意义。

刘军: 大家好我叫刘军,我是81年入学北大,85年本科毕业。后来参加了陈省身项目,86年出国先在罗格斯学习数学后来88年转到芝加哥大学读统计,91年统计系博士毕业之后在哈佛大学任助理教授。接着先后在斯坦福大学任助理教授、副教授,后来哈佛大学任终身教授。从00年开始一直在哈佛大学,今年正式离开哈佛大学,加入清华大学担任讲席教授。

墨子沙龙:当初是什么推动了您赴美留学?第一次踏上文化语言跟中国有很大差异的美国,您有什么感受?这段经历如何影响您后来指导国际学生?

刘军: 这问题有点宏大但是其实契机还是蛮简单的。我最早接触陈省身项目是因为听说陈省身项目有留学机会。后来我发现消息比我灵通的一些同学,他们知道不需要任何项目都可以申请留学。那时候我们很多本科生不知道自己可以申请国外学校的可能性。所以当时我们参加项目,国家给我们提供了很多帮助,也让我们知道了,有这么一扇门可以去外面的世界。申请完之后国家给我们培训一年,出资送我们出去留学,虽然算是“借钱”,但是我还是非常的感激。

当时我刚到美国,落地纽约JFK机场,是领事馆派车把我们接到领事馆,直到今日我仍然印象深刻。我坐在车里,傍晚时分,穿行曼哈顿街道,傍边的高楼大厦完全遮住了阳光,可谓是见识了所谓的摩天大楼。你想象一下,那时候我从小到大从来没见过十层楼以上的楼,而这一刹那,我走进了高楼林立的地方,感觉像是在电影里一般,一切非常魔幻。

其实现在的年轻人对世界的了解,比我们那时候要多很多,虽然这么说可能有很多片面性。我觉得在后来的生活中,我对同学们的教育有两点,一是很多不那么重要的事情要看淡一点,要真正抓住自己想干什么自己对什么感兴趣,分清主次,不要什么都关注,我觉得也顾不过来。另一个就是如果有能力的话,我觉得还是要做自己感兴趣的事情为主,就是什么事情你愿意下半辈子一直这个,比如我,比较适合做研究,喜欢去问一些问题,自己去想一些事情,按照大家现在所说的,要有质疑精神,我觉得每个科学家都会这么跟大家说。

墨子沙龙:您认为您在专业领域最大的成就是什么?可以用大众方便理解的方式跟观众介绍一下吗?

刘军: 我就厚着脸皮说一些。一个就是把统计学方法和一些比较先进的计算方法最早的跟生物信息结合起来。我是相当于最早用这些数据统计,AI或者说是机器学习的方法用在计算生物学,去解决一些生物学方面的问题。另外一个就是我研究了很多年蒙特卡洛算法,这是以抽随机样本来做近似计算的一套方法。最著名的大家可能知道比如说AlphaGo,底层的一个搜索方法叫查找蒙特卡洛树,这个就是相当于用蒙特卡洛的方法,做下一步搜索而并不是穷举的这么一套方法,非常的有效。

但直观的讲你可以说我们早年的工作并不是直接的去处理现在的大模型问题,而只是比如说你把现在的大模型比喻成一个大的波音747飞机的话,我们早年的工作,可能是研究哪种引擎效率更高、哪种引擎更稳定。另一方面如果要想做底层创新的话,可能还是得抽丝剥茧,要把它底层进一步简化,才能真正的有创新。

墨子沙龙:1993年您发表于《Science》的基因调控网络论文被引用超1600次。当时如何想到将统计模型应用于DNA序列分析?

刘军: 有很大的程度是一种机缘凑巧。我觉得主观上来讲,可能有几个原因。一个是我非常喜欢数学,我也对生物还是蛮有兴趣的,一直对生物这方面很好奇。因为我爷爷是个中医,对生物体怎么生病,生病的原因,还有生物的很多非常奇特的性质,经常会从从原理的角度去想,我觉得是非常不可思议的一件事情,也受到他很多影响。

但比较偶然的是,我当时做这个项目之前,是碰见了一个人——崔普劳伦斯。他是一个美国人,他原来也是学优化数学这方面出身。但是后来他就志愿到一个研究蛋白质DNA方面的实验室里面。他开始就是想用数学方法来做这些事情,但是他对统计了解的比较少。

我们在一次会议的时候碰上了,之后就开始聊,我觉得他的问题很有意思,他也觉得我给他讲的这些贝叶斯方法很有意思,所以我们就一拍即合。后来我们俩磨合了一段时间,我把我学的这些模型和蒙特卡洛方法结合起来,写了这一篇文章。

子沙龙:您认为“统计学是数据分析的灵魂”。在大数据时代,传统统计方法面临哪些新挑战?又该如何进化?

刘军: 这是一个非常大也非常重要的一个问题,也是我们这个领域很多的大佬们一直在思考的这么一个问题。

我个人的想法是,我觉得交叉科学,是我们统计学发展的一个基本的契机。很多的新方法和新的发展都植根于这种跨学科研究,就是要交叉科学跟别的科学去做,植根于新的数据处理方法。曾经我的导师最早有一个对我非常有影响的说法,就是跟着数据走。看看什么样的新数据出来,然后看看有没有用武之地。我觉得这是一个很好的策略,尤其是现在AI发展如火如荼。

另外一个,也是我们现在统计数据科学系一个重点之一,我们重点有三个,一个就是这种交叉学科研究,另外一个就是跟AI有关的基础性研究,这方面得到本领域的人越来越多的认可,衍生一些新发展出来的AI理论,就是像深度学习这些模型。另外一个就是想办法去用数学或者统计学的一些基本原理去研究它们内部的一些特色。

对于如何进化,我觉得一方面当然就是希望能够在研究这类的问题中,有一些新的创新。但从思想性来讲,我觉得统计学的一些基本的方法在里面起的至关重要的作用,所以我觉得作为我们这个领域应该要有胸怀,要包容或者借鉴现代发展的这个浪潮和技术,另一方面,还是要坚持这个跨学科研究,我觉得这两点对于统计学人至关重要。

墨子沙龙:您的跨学科研究令人印象深刻,关于跨学科研究,您对如今的年轻学生和科学家有什么样的建议?

刘军: 我觉得要有以下几点,一点就是一定有一两门非常能够熟悉运用的基本方法,或者说你基础打的非常好,有一些广阔的眼界和胸怀和兴趣,去看在什么地方有可能有应用价值。另外一点是比如说建立模型,从建模这个基本角度,对一些基础的概率、随机过程这方面也是要很了解,经常出错这一点还是要不得,要想真的创新技术发展,这种基本技能要掌握。另外一点眼界要开阔,有时候可以跟你的朋友、你的同学,比如中学同学或者其他地方的同事去沟通,聊一些各自学科中比较难的问题,从你的角度说不定就可以帮别人解决,那这样就是一个非常大的贡献。

文字整理:路飞

打开网易新闻 查看精彩图片