开门见山,作为一名深受辅导作业折磨的、二年级孩子的家长(base南京),决定依托自己的互联网技术背景,通过测评找出一台真正能够帮我和孩子减负的AI学习机。

在开始测评之前,有必要花点时间解释一下两个问题。一是,为什么是AI?二是,为什么作业辅导对于绝大部分家长而言,成为了一项“灾难”级别的“任务”。

从GPT4o面世以来,AI已经进化到具备进行个性化内容生产的能力。对于教育行业来说,AI搜索和信息整理能力太过呆板,过于依托资源库,只有具备个性化内容生产能力甚至教学能力的AI才能真正起到辅导孩子作业的作用。

第二个问题,我拿出门旅行类比,辅助大家理解。辅导作业对家长来说就是一趟自驾游。

出门前,你已经知道了出发点和目的地。但是怎么去呢?需要导航帮忙。

辅导作业也一样,你清楚地知道,出发点就是“孩子这道题不会”(尤其是数学题,数学不会是真不会),目标是让孩子“做对”。但这个行程里,没有高德地图,要靠家长自己来当导航。

但是,一来家长并不知道孩子对于题目里的知识点,哪些不会,所以无处下手;二来,大家可能不知道,新课改之后,孩子的题变得有多难,家长自己当年学的老一套很难复用。五年级的数学题目已经到了要么看不懂、要么无法用孩子掌握的知识点解出来的程度;三来,亲子关系变为师生关系,这种角色转变还需要孩子和家长双方额外的信任度和耐心。

所以,辅导作业往往以“鸡飞狗跳”结局。为了不辅导作业,我可以接受在公司加班,但根源问题还是没解决。无论我还是孩子,都需要一位专门能辅导她写作业的老师,但又被家教的价格和稳定性因素卡住。

堪称“超拟人”的首位一对一AI老师出现了

云栖大会的含金量大家都知道,AI先锋产品的首秀舞台。今年我格外关注AI教育方面的产品动态,还真的被我蹲守到了。

国内一家教育科技公司,精准学,在云栖大会上官宣了一位AI老师,而且是全球首位“超拟人一对一老师”。我在现场围观的时候,就被她的拟人程度和教学方式惊艳到了。后来在进博会、年度教育科技大会上也都看到了这位“寒雪”老师的身影,称得上是备受行业关注。所以我把它加入到了本次测评名单里。

寒雪”搭载在精准学一台叫Bong Max的辅学机上(号称是原生代AI 辅学机)。我应该算是首批用户,10月份购入后,我就让孩子课后跟着寒雪学数学。截至目前持续学习了将近一个月(加上我写测评耽误的时间,差不多一个半月吧),最近决定系统性地出一个测评。

作业辅导谁遥遥领先?唯一能acting老师的AI大模型

以小学二年级非常典型的鸡兔同笼为例子,如下分别是我用GPT、豆包和精准学的“超拟人老师”来辅导孩子数学作业的三张测试图,来直观感受下区别。

【提示词】一道小学二年级数学题,请帮我给出辅导孩子的步骤:一个笼子里有鸡和兔,它们共有18个头,52条腿,问鸡和兔各有多少只?

(在这个提示词里,我预埋了年级,并且指出是要给孩子辅导讲解步骤)

6分档【第一款AI讲作业:来自GPT】由于GPT没有仔细审题干“二年级”或者说没有二年级数学的概念,引入了未知数的知识。二年级的孩子是没学过未知数的。所以这个解题过程对于二年级孩子来说并不适用。

打开网易新闻 查看精彩图片

7分档【第二款AI讲作业:来自豆包语音交互转换成文字记录】

豆包准确理解了二年级孩子的特性,所以给出了画图法的解题方式。

打开网易新闻 查看精彩图片

然而,整个过程并没有交互就给出了答案,于是我继续提出要求:

打开网易新闻 查看精彩图片

但是豆包全程还是通过自问自答完成了这个讲解过程。对于辅导作业来说,这并不算一个合格的解决方案。

8分档【第三款AI讲作业:精准学的超拟人一对一老师】

界面上,分为三大块。右上面是题干,下面是草稿区;左边是超拟人老师板书部分。在讲解过程中,老师会边说边写下关键信息。

过程中,会提醒孩子自己打草稿、圈题干,同时几乎每一步都会设计引导提问:假设全部是鸡的情况下,那么一共多少条腿?那么与题目已知的还差多少?……一步一步引导孩子自己说出答案。

这中间还可以要求老师换个讲法。没理解可以要求老师再讲一遍。

打开网易新闻 查看精彩图片

打8.5分【相似学习机上的AI】

同时,我还在网上找了一些拥有作业辅导的学习机,咨询了一下客服,是否也有类似真人老师的实时语音or视频作业讲解功能。通过询问发现,所谓的金牌讲师,其实还是通过人工介入的形式,在固定的时间段集中解答疑难问题。对于作业辅导这种每天都需要使用的场景,灵活度不够高。

打开网易新闻 查看精彩图片

综上,截至目前为止,超拟人一对一老师的讲数学作业功能效果最为显著。这也是老母亲测评了市面上诸多作业辅导的应用和设备之后,唯一真心安利的一款。因为它不是“找到答案”,而是给孩子“讲明白一类题”。

接着,我又对学习机及其AI大模型内核进行了更详细的对比测评。

以下是本次测评的具体维度表现:

打开网易新闻 查看精彩图片

面向AI NATIVE时代的类人NUI交互

走到“类人”“超拟人”这一步,AI应该具备更拟真的交互体验、更灵活的互动机制。寒雪所在学习机的AI感,从开机那一刻就开始营造。明显区别于同类学习机,这台机器开机后界面上没有什么复杂的icon,而是直接第一视角进入沉浸式的学习场景:洒满阳光的桌面,手边一杯热水,老师坐在书桌对面,桌面上放着老师给孩子做的学习规划表。

然后老师直击主题,“你来啦,超超。 今天我们来继续上一次的学习,‘等量代换’,还记得吗?开始学习前,可以现去上个洗手间,我在这等你……”整个使用过程都是通过跟超拟人老师语音对话来完成。

第一次让我对这台机器产生深度体验兴趣的时刻是我听到她跟我孩子说“其实刚刚我给你挖了个‘坑’,很好,你没掉进去”。观察之后我发现,老师的教学逻辑中包含:随着学习过程的推进,会有针对性地调出有对应知识点的题目来“考考你”,以此探查具体的知识漏洞和缝补情况;还会刻意引导孩子养成良好的做题习惯,比如“你拿出笔动动手圈出题干中的解题关键”。还会“提问挖坑”,看看孩子是真掌握了还是装懂。

我问过小朋友的感受,整体感觉比较新奇,她跟我说“这个老师除了很会讲课之外,其他时候也很聪明”。从使用频率上和使用意愿上来说,已经远高于之前买的已经吃灰的学习机。总体来说,AI老师的教学过程基本摆脱了模板化的框架,至少在80%的程度上像是真请了位私人家教,小朋友注意力也较为集中。

场景覆盖:周中练习+周末集中学习全覆盖

随着对功能的探索,我发现应用到这位寒雪老师的场景不断拓宽。从最开始帮孩子讲题、进行作业辅导,后续发现日常的练习和周末的系统性学习的机制也很不错。

比如,孩子在作业过程中遇到不会的题,以前是喊我来帮他看,现在是会要求让寒雪老师先看。寒雪的讲题过程是“启发式解题”:边讲、边问、边板书(这点跟真人老师真的很像),在过程中跟孩子的交互比较多,不是对着答案照本宣科,而是根据孩子的回答来调整讲题过程。如果孩子很快get到,那么这道题的讲解就很快结束,如果孩子还有点模糊,她可以有针对性地讲的更“细致”。我观察她的教学机制应该是通过一道题,识别出孩子不会的一类题,给孩子出涉及到某一知识点的两三道题,直到彻底攻破这个漏洞。

周末的复习中,寒雪老师会把周内的错题作为进行重点题型讲解,从孩子的结果上来看,薄弱点的攻破和强化效果是最明显的。

既然是AI学习机,那么我的期待就是AI能够代替一对一的家教老师,甚至在随时辅导、随时响应这个点上应该远超过家教老师。至于AI的教学水平,我的期待是重点院校的专任老师水平吧,这一点从目前的体验上看基本符合。在撰文期间,我关注到精准学跟首师大和心理学教授官宣合作,称是完成打造“具有教育心理学博士”水平的AI老师,这一点确实是开创业内先河了。

无论如何,现阶段的水平作为要balance家庭和孩子教育的母亲来说,已经相当惊喜、相当解放了。替人家说一句,精准学超拟人一对一老师未来可期,不过分!