曾记否2017年5月27日的人机大作战,双方参加选手是人类最强围棋选手柯洁对阵来自英国DeepMind 公司出品的围棋软件 AlphaGo 2.0 ,最终的比分定格在了0比3,柯洁被打败。

打开网易新闻 查看精彩图片

开赛前的柯洁非常自信,认为自己是无可战胜的,但是经过此战之后,柯洁认识到了人工智能的恐怖,在近日参加活动的时候,柯洁在节目中说了赛后总结的对于人工智能的一些认识。他说人工智能太厉害了,实力相差很多很多,因为作为一个棋手一天下棋能下的数量是有限的,但是人工智能却可以下非常多盘的棋,只需要导入大量的数据,然后让算法运行,让它下就行。柯洁说自己平时也会和电脑下棋,但是现在的人工智能进步太快,可能以后再也没有机会赢过人工智能了。一天就可以下数万盘棋的人工智能,一直如此的训练下去,深度学习能力就非常的厉害了。也是因为对围棋的热爱,柯洁会一直下棋,并不会因为输给人工智能就放弃自己一生的热爱。

打开网易新闻 查看精彩图片

阿尔法狗围棋软件到底是厉害在哪里呢?我们深入了解一下人工智能,体会一下连柯洁都望而生畏的人工智能。

打开网易新闻 查看精彩图片

阿尔法狗把监督学习和强化学习相互结合,然后通过大量的大数据训练,形成了一个策略网络,然后把棋盘上的局势当做是一种信号,从而对所有的落子位置都会形成一个概率分布,依据大概率的落子原则执行。

阿尔法狗的三大核心技术:(1)蒙特卡洛搜索大框架,这部分可以看做是一种增强学习。(2)强化学习的学习方法。这种是根据一个行动的策略导致环境产生那些反映,奖励还是惩罚,然后就会根据这种离散的奖惩,去达到最优化,得到奖励最大化。(3)深度神经网络工具。这就是深度学习,这是人工智能领域非常重要的一部分,这就相当于赋予了机器以人的学习能力。

打开网易新闻 查看精彩图片

就是基于上述三大核心技术,阿尔法狗围棋在对战当中,会根据策略网络,寻找那个地方的落子是具有最高的价值,是最优化的方案,然后进行布局。落子期间会进行大量的计算,会根据盘面所有的信息去计算所有可能的概率。这种大量的计算是根据前期不断的训练的结果,然后再对局中依靠其强大的计算能力,战胜对手。