干货速递 | 优必选首席品牌官谭旻：让机器人走进千家万户|163

用人工智能赋能机器人，走进千家万户，携手通往未来之路。

作为国内估值排名第一位的人工智能企业，优必选集全球领先的人工智能和人形机器人研发、制造和销售为一体，目前已经推出了教育、娱乐、商用和家庭服务类的机器人。以下是优亿对优必选首席品牌官谭旻先生在第六届TopDigital创新发布盛典上的发言整理：

优必选对未来的思考，更多关注在如何实现机器人走进千家万户这样一个目标。远古人花了七万年左右从猿猴到直立，那么如果从人的年代慢慢过渡到机器人的年代，需要多少时间？对此，孙正义有一个初步的判断，三十年内，整个地球的人口会达到100亿，那时，全世界机器人的拥有量也将达到100亿，人跟机器人的配比是1:1。现在99%以上的家庭应该是没有机器人的，可以想象这个市场的发展规模和速度会有多快，预计在很短的时间内每个家庭拥有的机器人数量应该会超过拥有的汽车数量。

人工智能为机器赋能，让机器人更具“人性”

机器人的概念是指什么？大家想象中的机器人可能是无所不能的机器人战士，但到目前为止，现实大家能看到的机器人只是发展到工业4.0阶段比较成熟的机械臂、扫地机器人、低端的服务机器人和自动驾驶等。实际上，大家可能认为机器人时代是一个非常遥远的事，但是现在10后的孩子，实际上已经生活在了一个人工智能时代，生活在一个与机器人共同发展和成长的时代。

那我们应该如何认识机器人？机器人不外乎就是两个部分，一个叫机器，一个叫人。人工智能的赋能是什么？是赋予机器以人的能力，甚至超越人的能力和智慧，我们更多是看人工智能怎么赋能于机器来为人服务。

公众对机器人和人工智能的认知主要从AlphaGo击败李世石开始，对人工智能产生了敬畏。在这之前，人工智能只是停留在概念上，当真正看到人工智能击败人的时候，我们开始反思，人工智能对于人类是一个什么样的存在？从60年代简单的编程机器人，到90年代机器人的工业化应用，再到今天人工智能在视觉、语音等方面的大量应用，可以看到人工智能已经为机器人的发展奠定了一个非常好的基础，现在仿人形智能机器人的快速发展也得益于人工智能的赋能。

在人工智能的赋能下，我们对机器人的认知包括三个部分：第一，它首先是一个人的躯体，如果没有人的躯体它就只是一台机器；第二，是运动的能力，机器人生存在人的环境中，要走进千家万户，一定能够在家里行动自如，进入一些很复杂的环境，这样才能真正服务人类；第三，就是机器人的大脑，也是人工智能最核心的部分，怎么跟人互动、怎么理解人的意识？这是关键的问题。

机器人产业发展的三大核心挑战：运动、感知和认知

目前机器人产业发展的三个主要的挑战在于运动能力、感知能力和认知能力的发展，围绕这三大能力，我们的机器人是在不断迭代、不断进步的。

首先看运动能力。网络上很火的Boston Dynamics机器人视频，拥有很强大的运动能力，但这种机器人使用液压技术，整个身体非常重，它需要大量的动能，更多应用在B端，这种机器人目前来讲很难商业化，很难进入家庭。优必选Walker双足机器人运用的是伺服舵机技术，比较轻盈、灵活，目前行走速度能够达到1.6公里/小时，未来速度还会加快，能够实现和人差不多的行走能力，适用于家庭应用场景。

其次是视觉算法和听觉算法，视觉和听觉共同组成了感觉，这部分实际上就是跟人的交流，它决定了跟人互动的体验。一个机器人有非常多的感知零件，包括红外线、陀螺仪等，只有通过信息整合才能构成整个感知能力。在听觉应用方面，以智能音箱为例，现在智能音箱已经通过语音互动进入了千家万户，目前业界在语音技术上的突破已经能够实现类人的交流。在视觉识别方面，机器的人工智能是远超人类的，可以在毫秒内识别出一张合照上的几百个人，帮助我们解决非常多人的肉眼无法解决的事情。人类认识外界信息的80%来源于视觉识别，我们只有在视觉领域取得突破，才能让机器人真正服务于人类。

目前，我们在视觉识别方面的研究主要集中在四个部分：图象处理、机器视觉、深度学习和统计学习。ALPHAGO战胜柯洁的时候，实际上把围棋的逻辑变成了图象识别的逻辑，当机器的人工智能在图象识别部分能够与产生大数据的深度学习融合的时候，我们可以看到人工智能为人服务的可能性是多么难以想象。

除了静态图像识别，机器人在动态的多目标跟踪上也能产生非常有效的帮助。比如一个教练通过机器人观察所有运动员表现的时候，机器人会实时传输数据，告诉你这个运动员的表现怎么样、应该在哪里做出什么改变、对手的战术是什么。机器识别能够做出精准的判断，这是一个再有经验的教练都很难在现场做到的。

在机器识别的部分，主要解决三个问题，一是对人的识别，能够告诉你这个人是谁，包括家在哪里、是一个什么样的人、财务状况等等；二是对人行为的识别，比如我们现在做的反恐机器人，能够判断你的手伸到口袋里拿出来的是什么？这个动作的危险系数是多大，无论多好的反恐精英都不如这个机器人判断得准确，机器人可以通过大数据分析帮助我们做很精准的判断；三是理解人的动作和表情，表情是比较难的，我们很难同时对十张笑脸做出实时、精准的判断；例如在一个广场上，如何通过机器人对广场上的十万人同时做表情分析。

最后，就像盲人摸象一样，信息处理实际上是多维度、多视角的，如何把听觉、视觉与传感器不同的部分连接在一起，这就要回到统计和逻辑分析。当我们看事物的时候，人会根据他的经验判断因果关系，同样，在人工智能的深度发展阶段，机器人也会判断为什么一个人在这个地方出现，它出现会干嘛？通过多维度的统计学分析、深度学习，在很短的时间内拼出一头真正的“大象”，这也是机器人真正能够走进千家万户的一个很关键的部分。

机器人助力未来社会更便捷丰富，打造人类美好新生活

未来，机器人会成为下一代消费级智能终端的入口。从PC端到移动端，我们的交互方式从键盘发展到触屏，下一步就是完全解放双手，不需要敲打键盘，不需要通过任何的物理界面来沟通，完全像是人跟人面对面的交流方式那样自然。所以，人机交互的发展方向是如何让人机互动和人跟人的交流一样有温度，而不是让人觉得是和一台机器在交流，这是很关键的，也是我们认为语音互动不能够成为一个核心入口的原因所在。

最终，人形智能机器人在运动控制和人工智能上将无限接近于人，以后你可能抬头看了一眼，机器人就知道你想让它倒一杯茶，这是一种全新的交互模式。从大数据的角度，机器人应该有主动收集数据的能力，因为它跟你生活在一起。我们期待在30年内，每家每户都将拥有超过汽车数量级的机器人，希望机器人真正走进千家万户！

近期文章推荐

（点击文字直接阅读）