北京时间2月18日,

被马斯克称为

“地球上最聪明的人工智能”

Grok3推理模型

亮相发布会直播现场,

他和带队工程师分坐两旁,

将C位留给了两位

主要负责模型研究的华人科学家。

其中一位是多伦多大学计算机科学助理教授Jimmy Ba,另一位是xAI联合创始人吴宇怀(Yuhuai(Tony) Wu)。

直播画面中,马斯克与三位技术负责人并肩而坐,包括带队工程师Igor Babuschkin,以及上述两位华人科学家。马斯克本人坐在一旁,还谦虚地说自己“什么也没干”。直播过程中,马斯克更是全程“疯狂点头”。

Grok-3发布会截图 右二为吴宇怀
打开网易新闻 查看精彩图片
Grok-3发布会截图 右二为吴宇怀

马斯克AI公司联合创始人之一

是杭州95后学霸

直播画面里,四人中唯一身穿浅色上衣的年轻人(图中右二),引起了很多人的关注,他就是来自杭州的95后小伙吴宇怀!

这一消息瞬间刷爆杭州人的朋友圈。

吴宇怀1995年出生。 小学一年级在新安江一小读书,之后转学到杭州紫阳小学。 初中就读于杭州建兰中学,随后转到加拿大读高中。

打开网易新闻 查看精彩图片

△吴宇怀在杭州建兰中学

2015年,吴宇怀以满绩点的成绩,毕业于加拿大纽布伦斯威克大学;2021年,博士毕业于多伦多大学机器学习专业,做过“深度学习之父”杰弗里·辛顿(GeoffreyHinton)的学生。博士期间,他还曾在谷歌DeepMind和OpenAI实习,此后在谷歌任职并同时在斯坦福做博士后研究。

2023年7月,xAI成立,吴宇怀加入并担任联合创始人。他的海外社交账号,首页至今置顶着当天的一条内容:“解决数学问题,了解宇宙本质。”

打开网易新闻 查看精彩图片

吴宇怀曾在一次分享中介绍,他立志于创造一个善于推理的人工智能,用于解决所有数学难题,他以数学作为研究推理的起点,目标是创造一个自动化的AI“数学家”。此前,他的部分研究被《Quanta Magazine》《纽约时报》报道。

2月19日,吴宇怀初中数学老师告诉媒体,吴宇怀当时不上任何培训班,从不超前学习,还爱臭美,但他对难题的执着程度,是其他同学不能比拟的。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

截图自浙江经视

除此之外,吴宇怀小学老师回忆称,吴宇怀当时性格就特别好,情绪非常稳定,对未知领域有特别的好奇。吴宇怀的小学老师还特别表示,他本人很喜欢吃大马弄的春卷。


打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
截图自上城发布
打开网易新闻 查看精彩图片
截图自上城发布

xAI创始团队12人中

有5张华人面孔

2月18日发布会现场的另一位华人科学家JimmyBa是多伦多大学计算机科学系的助理教授,也是xAI的初创团队成员。

公开资料显示,Jimmy Ba在多伦多大学完成本科、硕士及博士学习,也师从杰弗里·辛顿(Geoffrey Hinton)。

他的研究重点是深度神经网络的高效学习算法开发,还涉足强化学习、自然语言处理和人工智能等领域。他是训练深度学习模型的首选算法之一Adam optimizer的开发者。Adam optimizer即自适应矩估计优化器,是深度学习常用算法,由Jimmy Ba和另一名科学家在2014年提出。

2016年,Jimmy Ba获得了Facebook机器学习研究生奖学金;2023年2月,荣获斯隆研究奖。

值得注意的是,据媒体此前报道,算上吴宇怀和JimmyBa,xAI创始团队12人中,就有5张华人面孔。

打开网易新闻 查看精彩图片

比如张国栋,本科就读于浙江大学信息工程专业,大学时连续三年排名专业第一,拿了三年的国家奖学金,还获得过全国大学生数学建模竞赛一等奖,美国大学生数学建模竞赛一等奖。大二时,他对人工智能产生了浓厚兴趣,投入到计算机视觉领域的研究中;大三暑假,跟着全球著名计算机视觉专家朱松纯从事相关研究。

打开网易新闻 查看精彩图片

图片来源:都市快报

不少网友纷纷表示,Grok3与DeepSeek的PK是校友间的PK。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

另一位联合创始人杨格出生在湖南,本硕就读于哈佛大学数学系,大学时期的导师是数学家丘成桐。在加入xAI前,他是微软的高级研究员。

还有一位戴子航,本科就读于清华大学工商管理学,硕博就读于卡内基梅隆大学计算机科学学院。他曾在网易、百度深度学习研究所、谷歌有过实习经历,2020年成为谷歌大脑的研究科学家。

值得一提的是,华人一直在全球AI研究中占据重要位置。

2024年中,OpenAI发布GPT-4o后,GPT-4o关键团队成员就被解析。据报道,17位团队成员中,有6人是华人,本科分别来自清华、北大、上交、中科大等。

2023年5月,IEEE IS评选出“人工智能十大新星”,就有9位华人获奖!

据参考消息网援引《日本经济新闻》2月18日报道,麦克罗波洛智库的分析显示,在美国企业和研究机构专门从事AI研究的顶尖学者中,毕业于中国本土大学的人数最多,他们很多都是在中国大学完成本科学业后前往美国攻读研究生的。2019年这一比例为27%,2022年已经达到38%,而当年毕业于美国大学的AI研究人员占比是37%。

日本理化学研究所创新智能综合研究中心主任杉山将认为:“一定比例来自中国的优秀年轻人正在为(美国)企业和研究机构的发展作出贡献。”

马斯克,放大招!

发布号称“史上最聪明AI”

此前,马斯克在社交平台上称Grok 3是“地球上最聪明的人工智能”,并称该产品的推理能力将超越包括ChatGPT和DeepSeek在内的其他领先AI模型。

据悉,在Grok-3发布会背景板上,写着“Our mission is to understand universe(我们的使命是了解宇宙)”。马斯克曾表示,xAI公司的目标就是“了解宇宙”。

马斯克在直播中表示,Grok的名字来自海因莱因的小说《异乡异客》,主角是一个在火星上长大的人类,而Grok这个词代表了全面深刻地理解事物。

马斯克称,Grok 3在很短的时间内超越了上一代Grok 2,“我们认为它比Grok 2强大一个数量级”。另据xAI公司的工程师介绍,Grok 3所涉及的训练是Grok 2的10倍。

根据马斯克的介绍,Grok 3最大的特点在于引入了“思维链”推理能力。该能力让Grok 3可以像人类认知过程一样逐步处理复杂任务,显著提高了模型处理复杂查询和提供更连贯、更有逻辑的响应的能力。

美国“福布斯”网站称,xAI公司表示,Grok 3的开发速度得益于使用了由英伟达H100高性能GPU芯片组成的全球最大AI超算Colossus进行训练,“计算资源的显著提升帮助Grok 3更高效地处理大型数据集,缩短了训练时间并提高了准确性”。

报道提到,除了提高计算能力之外,xAI还调整了其训练方法以改进 Grok 3的能力。例如它采用了合成数据集,即人工生成的专用数据集,而不是真实世界的数据,通过模拟各种场景来训练AI模型,确保数据集多样化且受控。这有助于提高AI的学习效率并解决数据隐私问题;Grok 3具备自我纠正机制,即允许大模型识别和纠正自身错误的AI技术,它通过评估其输出并将其与已知的正确响应进行比较,可以随着时间的推移优化其答案,从而减少错误并提高准确性;此外Grok 3还具备强化学习能力,该系统经过训练,可通过反复试验最大限度地提高积极结果,从而提高其决策能力。

根据xAI和马斯克的说法,这些改进将通过使用多个验证步骤来减少机器幻觉问题的出现,通过可靠来源检查信息来提高逻辑准确性,并通过持续的自我评估和学习更有效地适应。xAI还宣称,Grok 3已经引入人工反馈循环和上下文训练,以确保更自然和准确地响应。

不过也有分析认为,在中国DeepSeek大模型推出后,未来是否还需要类似OpenAI或xAI这样利用“大规模堆芯片和算力”的昂贵代价来推进AI发展成为业内关注的焦点。OpenAI首席执行官奥尔特曼此前表示,DeepSeek让OpenAI的领先优势不会像前几年那么大了,他表示,在开源模型和研究成果的问题上,OpenAI已经站在了历史的错误一边,需要制定不同的开源策略。

19楼(my19lou)综合自中国经济网、潮新闻、都市快报、建德发布、每日经济新闻、澎湃新闻、大众日报、参考消息、浙江经视、上城发布、网友评论等

打开网易新闻 查看精彩图片

编辑:木木

审核:宛如

↓↓↓猛戳下方阅读原文查看“刘强东是第一个”!京东宣布:为外卖骑手缴纳五险一金