吴 翼:清华大学交叉信息研究院助理教授

“强化学习”是机器学习的子领域。2017年,“强化学习”因“能使计算机在没有明确指导的情况下像人一样自主学习”入选《麻省理工科技评论》“全球十大突破性技术”。

近几年,强化学习领域的代表性研究项目有2019年OpenAI机械手单手拧魔方,该项目采用了名为 “自动化域随机”(Automatic Domain Randomization,ADR)的新技术,第一次证明通过强化学习可以做一些机器人传统控制做不了的事情,从纯模拟进化到现实转化;笔者曾在OpenAI参与“捉迷藏”项目,该项目是小蓝、小红两个智能体在虚拟世界里利用墙和箱子两种道具玩“捉迷藏”游戏,通过该项目我们发现假如给智能体一个开放性足够的物理空间,智能体可以自己去学习一些令研究人员意想不到的行为。此外,正在进行中的其他相关项目有利用强化学习使机器做出符合人类动力学的行为,如击剑、拳击等。