(黄士杰在DeepMind办公室)

本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯 12月13日】凌晨,AlphaGo曾经的“代言人/人肉臂”、谷歌DeepMind科学家黄士杰(Aja Huang)博士今天凌晨在Facebook上发帖宣布,他本人将正式从AlphaGo团队离开,转到DeepMind其他项目的研究中去。

(黄士杰Facebook发帖)

据了解,早在今年5月战胜世界围棋第一人柯洁后,DeepMind就曾宣布,从今往后AlphaGo项目将不会再继续开发,AlphaGo也不会再参加竞技比赛了。与此同时,DeepMind也初步披露了AlphaGo团队的下一步计划——研发出应用领域更广泛的算法,包括找到新的疾病治疗方法、显著降低能源消耗、发明革命性的新材料等。

11月27日,黄士杰在Facebook转发了一则关于DeepMind将与一些顶尖的研究机构共同投入诊断乳腺癌的AI研究消息。DeepMind将利用最新的机器学习技术,希望能够快速、准确地检测出癌症的迹象,帮助医生尽早发现癌症,以便更早的有效治疗,所以,他之后投身医疗研究的可能性非常大。

对于著名的AlphaGo、人机大战、柯洁,大家可能非常熟知了,但黄士杰是谁大家可能并不熟悉。

(黄士杰博士代为执子)

黄士杰博士是一名台湾工程师,AlphaGo的幕后推手,黄士杰从小热爱围棋,在台湾师大读书时就曾经创办了学校的围棋社,还曾获得大专杯围棋赛冠军,是个业余六段围棋选手,在校取得了辉煌成绩的黄士杰通过博士论文口试之后就被加拿大一所大学挖走,担任电脑围棋程序研究员,1年后被英国一家专门研究人工智能的公司DeepMind招揽,2014年,DeepMind公司被谷歌并购,黄士杰已经是公司内两位首席工程师之一。

(从左至右,哈萨比斯、柯洁、席尔瓦)

黄士杰至此开启了DeepMind生涯,有一天,席尔瓦走到黄士杰面前说:“Aja,我们准备启动一个围棋项目,最开始只有你和我”。2014年2月,AlphaGo项目正式启动,团队三个人:哈萨比斯、席尔瓦、黄士杰,哈萨比斯是整个公司的老板,席尔瓦是黄士杰的经理。所以,这个团队真正干活的只有黄士杰一个人。AlphaGo项目想搞出一个强大的围棋程序,并且沿着深度学习和强化学习的方向探索。

两年之后的2016年3月9日至15日,他们带着AlphaGo惊艳世人,从此所向披靡,战无不胜。

我们期待黄士杰的新征程,他不仅仅是人手臂,人工智能时代的大幕才刚刚开始!

所以,DeepMind团队带着新的使命,发表了全新的强化学习算法AlphaZero。

它是一种可以从零开始,通过自我对弈强化学习在多种任务上达到超越人类水平的新算法,堪称“通用棋类AI”。

据了解,AlphaZero算法可以在8个小时训练击败李世石版本AlphaGo;再用4小时训练击败世界顶级的国际象棋程序Stockfish;再用2小时训练击败世界顶级将棋程序Elmo。这是DeepMind团队继AlphaGo Zero的研究问世之后,带给我们的又一全新算法,它是“更通用的版本”。

此外,我们看到这次的AlphaZero与AlphaGo Zero有几点不同。

首先AlphaGo Zero是在假设结果为赢/输二元的情况下,对获胜概率进行估计和优化。而AlphaZero会将平局或其他潜在结果纳入考虑,对结果进行估计和优化。

其次,AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强,而AlphaZero不会。

第三,AlphaZero只维护单一的一个神经网络,这个神经网络不断更新,而不是等待迭代。

第四,AlphaZero中,所有对弈都重复使用相同的超参数,因此无需进行针对特定某种游戏的调整。

关注网易智能公众号(smartman163),获取人工智能行业最新报告。