2024 年 12 月 11 日,多鲸在深圳深科技城举办2024 多鲸EE年会暨「智汇鹏城·共创教育 AI 新未来」——福田教育科技产业园集中签约仪式。
圆桌论坛「 AI +教育:重塑教育生态」由知智教育创始人兼 CEO 李卓主持,嘉宾包括英语趣配音 & AI 外教创始人谭美红、悉之智能创始人兼 COO 代佩霖、高木 AI 学习创始人刘瞻、华图教育高级副总裁兼一起考教师创始人蔡金龙、图灵机器人联合创始人郭家、道道创始人杨洋。
以下为圆桌论坛实录,经多鲸编辑整理:
李卓(知智教育创始人兼 CEO):今天的主题是「 AI 重塑教育生态」。所谓「重塑」,前提一定是 AI 能为教育行业带来实际的收益,真正帮助从业者在教育领域中获利。因此,AI 的落地在这个过程中显得尤为重要。但围绕这一点,我们也面临一些迷思,其中一个关键问题就是关于「内容」的价值。
一方面,有人认为自己拥有非常优质的题库、录播课以及各种教学资源,比如讲义、PPT 等,堪称业内一流;另一方面,也有人提出,AI 的出现使内容生产变得无限可能,这是否意味着原有的内容优势将逐渐失去价值?围绕这一问题,我想请教各位专家的看法。
首先,我想从有自主模型研发经验的专家开始提问。您认为,在基于自研模型的应用中,模型和内容之间的关联关系是什么?
代佩霖(悉之智能创始人兼 COO):首先,从我们的视角来看,人工智能确实能够极大地提高内容生产的效率,在一定程度上也能提升内容生产的质量。然而,在教育这一容错性极低的场景下,目前人工智能直接输出的内容还较难直接达到可应用落地的程度。我们公司的产品主打虚拟 AI 老师的互动解题和答疑。在此方面,我们知道,即使是像 GPT-4 这样强大的模型,在解题推理方面依然会出现很多幻觉问题、计算错误等基础性问题。这与生成式模型本身底层的技术原理密切相关,很难完全规避。就好比一个读过世界上所有书但却没有严肃学过一天数学的人,很容易出现此类问题。而在教育领域,对教学产品的正确率要求极高,可能 95% 都被认为是低的,甚至要求达到 98%、99% 以上,因为一旦出现错误,就可能误人子弟。这其中存在着深刻的矛盾,目前的 AI 技术远未成熟。
为此,我们做了很多工作。例如,自研了一套大模型可调用的工具包。虽然模型本身容易犯错,但有了这套精准的工具体系,当模型在进行计算和推理时,只要正确调用该工具,输出就一定是正确的。这就如同人做计算也会出错,但学会使用计算器后就不会出错。通过这种方式,我们确实将基座模型在学科题目上的准确性从百分之六七十提升到了百分之八九十的水平。但在应用场景中,这还不够。不得不说,优质的内容永远是稀缺且有价值的,尤其是在教育场景。家长在有能力的情况下,一定会给孩子最好的,所以对内容质量的要求非常高。因此,我们坦诚地讲,在一些实际落地应用场景中,我们甚至会进行最后一关人工审核,以确保整体的准确性。
此外,悉之整个内容来源很重要的一点是签约了一批名师,这使得我们的训练数据起点足够高。
李卓:在此,我想请教一下图灵机器人联合创始人郭家先生,在从数据到调整模型再到进行产品优化的整个过程中,在做模型时遇到了哪些问题,又是如何解决的呢?
郭家(图灵机器人联合创始人):讨论内容问题需要从更长远的视角来看。我们接触很多做内容的公司,他们的内容需要长时间的沉淀和积累才能产生价值。如果只是在一周或一个月内制作高质量内容,不足以成为内容公司的价值和壁垒。但如果放长线看到半年到一年,我们会发现最近 AI 发展迅速,就像经历了 「AI 春节」,GPT 不断发布新内容。从半年的视角看,其替代能力必然远高于现在的水平。这是一个大前提,基于此前提来看半年后我们应该做的事情。
从刚才悉之的角度,我再补充两点关于高质量内容的定义。除了不犯错、没有语法错误且符合要求之外,我认为高质量内容还应具有温度和情感,这在教育方面尤为关键。另外,还应具有创造性。我个人认为,基于半年后有价值的事情,在内容生产方面有两个要点。第一个是个性化的内容。如今用户需求逐渐个性化,生产符合特定学生或某类学生需求的内容会非常有价值,这是光靠通用模型无法解决的。第二个是有品牌价值的内容。即便生产能力越来越快,高品质内容也能更快地被生产出来,但如果内容蕴含文化表达和情感表达,就会更有价值,因为其背后加持着品牌的价值。这对于内容生产公司来说,这非常关键。
谭美红(英语趣配音 & AI 外教创始人):我们英语趣配音在去年生成式 AI 出现时,基于应用层面做了很多探索。第一,对于语言学习类产品,大家通常会想到发音不好时希望有人纠正。线下可能有老师比划口型,但在线上如果用真人则价格贵且不易约到。我们基于深层次 AI 以及 AI 的能力,一是能够把发音问题精确到音素级别,二是结合平台发音视频内容,切成非常细的音节口型图,帮助用户学习。第二,语言学习分为输入和输出。过去十年,英语趣配音一直从事英语的看、听以及模仿,在输出方面相对较少。我们也尝试过做真人外教,今年一、二月份有报道说我们这家公司十年四次尝试做真人外教都失败了,这一次真的要成了。我们现在的实现路径是,前面听的内容还是动画片及教材内容,可以看、听和模仿,再往后运用 AI 进行复述。复述的内容有源之水,即前面学到的内容类型,后面由 AI 外教以一对一提问的方式帮助用户输出理解,效果非常明显。第三,AI 在我们的内容生产层面也扮演着重要角色。过去我们的内容来源主要有与大 IP 版权方合作(如小猪佩奇、迪士尼)、与出版社合作(如人教、外研社、译林出版社)以及自己生产(以前有四五十号全职人员生产,效率低)。现在运用深层次 AI 的能力和相应工具,提效至少 200 倍以上,内容生产速度非常快。在未来,AI 的能力对于口语学习,无论是英语还是其他语言,效率将远超我们的想象,使学习效率更快、更容易。
杨洋(道道创始人):关于这个问题,我不确定自己是否是合适的回答对象。我 2012 年回国加入哈工大,哈工大主要的人工智能团队都是做知识图谱的,但我例外,我是做模式识别的。从纯技术角度而言,现在大模型技术不太需要知识图谱,而更需要逻辑链和思维链。传统做知识图谱都是用人工去手动打标签,这种方法已经过时了,没什么生产效率。而现在基于大模型去做知识图谱,效率要高很多。而据我所知,还有非常多的公司在用传统的知识图谱的生产方式在做,这样的做法应该被淘汰了。
所以,从这个角度来讲,我只能直接回答,甚至可以说有些可悲的是,中国 99% 做人工智能的教授,现在可能会觉得过去一辈子做的绝大部分科研成果到现在应用价值都不大了。包括我自己,刚回国那会儿,很多大公司给我开很高的薪酬,但如果现在去找工作,当年引以为傲的世界领先的 AI 技术,现在基本上找不到工作了,都已经被大模型这波新的技术浪潮完全替代了。
李卓:杨洋博士认为传统的做知识图谱的方法已经过时了。因此,当媒体报道或者有人找你加盟时提到这个概念时,你需要打一个问号。高木在知识图谱也有很多布局,那站在AI大模型的角度,刘瞻兄如何看待知识图谱?
刘瞻(高木AI学习创始人):站在 AI 大模型的角度这个问题实际上是从内容角度出发的。首先,在2012 年谷歌开展的知识图谱项目,并不适用于教育领域,教育不仅仅是搜索问题,还要给孩子导航、指引和启发等等。它需要被改造为教育知识图谱,由于时间有限,我们不具体讲教育知识图谱与一般知识图谱的区别,直接回应与大模型之间的关系。生成内容时,可以理解为大模型是一个文科生,虽然可以优化参数让它凑出一本数学书,但与真正理解数学是两回事。这时如果有个理科生帮忙检查,看看是否符合物理定律、数学公理,这是非常重要的。其次,从内容出发,我们知道现在内容生产可能不是主要问题,主要还是内容的个性化。知识图谱或者说教育知识图谱的目的是对好的内容进行智能化改造,使其变成个性化的内容,给到每个孩子,培养他们的自主学习能力。只要内容足够合适,孩子就能自学,自己学会好过老师教会。最后,之前讲话的领导也特别讲到了福田区的认知模型,这说明知识图谱以及原来的符号推理逻辑模型也是在发展的,不是一成不变的。比如加上学生的认知风格、路径能力,就从一个单纯的学科模型发展成了学科+学生模型,对个性化学习效果影响非常大,在福田已经取得了显著成绩。
蔡金龙(华图教育高级副总裁,一起考教师创始人):我们站在一个公司内部提效的角度看,在 AI 时代创造什么样的好内容?如何创造好内容?我简要给出我们的基本认识。
第一个观点是我们会坚持人机混合智能,至少在相当长的时间内会如此。我们有几千个老师,在面向外部的功能推出之前,先进行面向内部提效,而在这过程中天天思考的就是如何实现人机混合智能。既要解决纯机器无法完全保证正确率的问题,又要解决纯人工效率不高的问题,所以应该各归其位,让机器去做效率的事,让人去关注准确性的事。比如在命题这件事上,我们设计了机器命题+人工筛选的工作流,把生产和审核分离。所以,做好内容的第一件事是坚持人机混合。
第二个,我们烦恼的是什么呢?洗稿。好不容易用人机混合造出了好内容,从前端营销到后端教研资料都有可能被瞬间洗稿,既使用了你的观点又看不出你的样子,这可能是整个行业后面都会面临的问题。为应对这个问题,我们提出了三个字 「特细新」。特,就是个性化的材料,教育是追求因材施教的,高效学习必然有个性化的内容,这是洗不走的。细,就是把任何东西打低一个颗粒度,比如把所有的单选题打成判断题,在这个过程中内容量极大丰富,做细的内容暂时还洗不了,因为做完后只有我们知道全集,其他人只能知道一个子集。新,就是新创造的内容,时效性强的内容。我和媒体朋友交流时,他们说不怕被洗稿,因为永远追求速度。所以,我们在内容上的思考用三个字概括就是「特细新」,即个性化的内容、颗粒度更细的内容以及更新的内容。
李卓:AI 时代大家讨论最多的就是到底 AI 会不会替代老师?讨论概念并非最为重要,关键在于了解实际落地中他人的做法。接下来请大家分享一下自己的看法。
谭美红:在我们的业务体系中,英语趣配音并无真人教师,无论是英语趣配音还是 AI 外教,均致力于为真人教师赋能。例如,在过去十年间,众多学校教师借助我们的趣配音为学生布置电子作业,此时我们扮演着辅导者的角色,主要负责作业布置与组织竞赛等事务。去年,基于深度 AI 技术,我们推出 AI 外教,专注于口语输出训练,其角色为陪伴式练习者与教师辅助者。在此,我分享两个案例。其一,北京师范大学昌平校区高二的一位英语教师在课堂教学中,以琼瑶因身体疾病在家中结束自己生命这一新闻事件为契机,发起关于 「当人的生命处于极度痛苦阶段时,应继续还是结束生命」 的话题探讨。课堂伊始,教师进行导入,随后在课堂进程过半时,每位学生借助 iPad 与各自的 AI 老师展开交流。由于学生的口语词汇量与知识储备各异,AI 外教能够依据学生的个性化需求提供服务,使课堂教学兼具个性化、高知识储备与高质量回复的特点,打造出智能化课堂。其二,在 B 端层面,重庆德普外国语实验学校由孟晚舟与他先生共同投资创办,全校一千余名师生均使用我们的产品。周一至周四晚间,学生与专属 AI 外教就当日英语课程主题内容开展一对一、时长 30分钟的练习。此举有效解决了外教聘请成本高昂、时间预约不便以及传统教学难以实现一对一教学等问题,能够更好地实现同步学习与练习,提升学习效果。就 C 端用户群体而言,以我从事英语教育创业 16 年、涉足互联网行业自 2013 年起的经历来看,AI 时代借助此类方式得以实现为每个学生配备外教老师的目标。
代佩霖:除英语学科外,我们在众多其他学科领域也开展了大量探索工作。由于我们是清华孵化企业,公司内部清北背景的教师比例比较高,这些教师在行业内属于稀缺且昂贵的教育资源,并非每个孩子都能获取。于是,我们借助 AI 技术克隆这些教师,克隆不仅涵盖形象层面,而是让 AI 教师在形象、声音与外貌上与原型教师保持一致,在此基础上,AI 教师还将系统性学习原型教师的课程体系与学科体系,从而深入理解其课程框架与教学思路。当前,我们正与部分学校及 AI 自习室合作,探索高效且个性化的 AI 自习模式。课上,我们将清北优秀教师的优质教学内容 AI 化,转化为虚拟教师与学生展开个性化、高密度的实时互动,确保学生在学习过程中能够紧跟课堂节奏,充分参与课堂学习,进而实现知识的有效吸收。如果大家对我们的产品感兴趣,目前已有上线产品可供访问与下载,欢迎大家尝试体验。
李卓:教培机构场景为一方面,公立学校的师生比例相对较高,在此情形下,AI 教师能发挥何种作用呢?接下来,有请郭家为我们解答。
郭家:我们为北京海淀提供服务,众所周知,海淀是教育高地,教育资源集中且教师水平高超,对大模型要求严苛。我们参考 GPT 做法,今年 GPT 与 Common Sense Media 联合发布了名为 K12 教师课的课程,该课程包含三个部分:一为原理部分;其二阐述 GPT 如何助力教师教学;其三展示在美国高校与技校中的应用案例。
我们据此为海淀教师提炼出以下合作要点:第一,作为备课助手,教师备课工作量大,除教学与批改作业外,还需筹备备课时间,而 GPT 在备课内容生成方面效果卓越,可直接生成 PPT 与教学大纲,在北京的应用试点中效果显著。第二,作为教学计划助手,主要用于课前与课后协助教师梳理学生问题。因学生存在个体差异,该助手能够帮助教师快速梳理并制定相应教学内容。
刘瞻:公立学校教师如何借助 AI 实现自我提升?我们从教改视角出发,这种视角与教师助手视角有不同,但也存在共性。从教改以终为始的视角来看,我们致力于培养未来创新人才。
当下大规模标准化教育或以教师为中心的教育模式,在过去工业化时代培养标准化人才时成效显著,但如今却可能成为发展的阻碍。为突破此困境,需实现五个转变:从统一走向个性,从预设迈向生成,从讲授转为自主学习,从课时设计到单元统整,从知识传授到能力培养。在此过程中,需打造动态生成课堂,使个性化学习在课堂中得以充分体现,并注重培养学生的创新能力,如发散性思维、批判性思维与人机共创思维。例如上周的二次函数数学课,临近尾声时,学生与 AI 探讨该函数在物理、生物、商业等跨学科领域的应用及所能解决的问题。这不仅有助于提升学生的数学学科核心素养,还能促使其对机器的观点进行批判与质疑,进而培养批判性思维。
李卓:AI 在教育领域既带来机遇,也提出诸多挑战。杨洋在道道研究院担任学习规划师这一重要角色,接下来请杨总详细介绍一下学习规划师在 AI 时代的独特价值。
杨洋:提及学习规划师的价值,需要追溯我们开展这项工作的缘由。最初,此项工作由新东方委托,新东方在商业运营中发现,家长对自己的孩子了解程度极低。从商业角度而言,家长对孩子越不了解,越有可能在新东方消费,但新东方好奇家长对孩子的不了解程度究竟如何。于是,委托我们借助 AI 建模对孩子及其父母进行全面自动化评价。
历经七八年时间,我们已对超过 700 万个家庭进行了评价。在此,我分享一些令人惊讶的数据:超过 80% 的父母对自己的孩子极为不了解,甚至存在将天才儿子误认作智商不高的情况;全国 73.3% 的孩子存在厌学现象。
在 AI +教育的当下,我们需要思考,教育的目的究竟是培养高效的考试机器,还是其他?我们公司的 CTO 曾言:如果不看考试成绩,觉得自己的孩子各方面表现良好,但一旦关注考试成绩,便觉得孩子一无是处。这是真正的教育吗?教育包含教与育,教侧重于技能传授,育则注重培养优秀人才。但是当前 AI +教育多聚焦于知识点学习,而我们认为教育应回归以人为本,先明晰孩子的真实状况与学习情况,再进行针对性培养。
学习规划师的职责并非传授知识点,而是真正实现因材施教,深入了解孩子的本质,为家长提供清晰的认知。每当我们将报告交付家长时,多数家长都表示惊讶,感叹原来自己的孩子竟然是这种模样。如果基础性问题未得到解决便空谈 AI +教育,实乃荒谬之举。由此可见,学习规划师的作用至关重要,值得大家深入学习与研究。
蔡金龙:作为教师,本质是既教书又育人,希望借助 AI 工具来实现这两者的兼顾,我们的方式是激活教师的潜力,让他们不仅仅是被动地使用工具,而是积极参与到AI应用的设计与开发中来。我们有数千名教师团队,如果每位教师都能参与到创建AI智能体的过程中,很多教育细节被改造,教与育的效果将得到显著提升。
和有兴趣有能力的老师达成共识,咱们大家一起共同去「搓」智能体,构建智能体及多智能体工作流。通过细分具体的工作任务,确保每个任务都有清晰的边界,并利用智能体解决这些问题。如果任务足够细分,边界足够清晰,智能体的幻觉会极大减少。对于教师来说,这意味着学会如何定义边界并创建这些智能体;如果遇到困难,我们将提供支持,帮助他们完成。随着越来越多的智能体被创建出来,教师们会感受到这是他们自己或团队努力的成果,从而增强参与感和成就感。
比如我,已经「手搓」了超过 40 个教学相关的智能体来辅助日常工作。这样做的结果是,每个老师都能把自己活成一个教研室。
李卓:最后一个问题,大家从自己的产品出发,讲一讲明年计划为儿童做哪些 AI 内容?
杨洋:我们的核心是以医疗模式实现因材施教,先明确孩子特质再规划发展路径。目前,已经为多家教育机构提供了支持,帮助他们实现个性化教学。我们的目标是深入了解每个孩子的特点,并据此制定发展计划。在过去的一年中,我们已经为 200 多位教师提供了支持。现在面临的主要挑战是教师培训成本仍然较高,目前需要七天时间,而我们的目标是将这一时间缩短至一小时。
郭家:作为算法公司,虽然与用户距离稍远,但从公司视角看,国内现有 100 多家大模型公司与做算力的企业。我们认为不应单纯追逐美国模型与算力,而应聚焦教育垂直领域开展数据训练,构建教育垂直大模型,主要方向为多模态,以实现图像等多种元素交互变革,期待推出教育版产品。
蔡金龙:我们的计划是通过 AI内部提效,使效率提升数倍,并适时推出我们细分领域的 AI 功能和 AI 课,来同时保证学员正确率和速度都得到大幅提升。
刘瞻:我们高木 AI 学习主要通过服务学校来服务学生,目前已覆盖 2000 所学校和 200 万学生。我们的理念是培养未来的创新能力,同时确保学生在当前的学习中不会落后,至少不走弯路。我们将继续为学生提供体验,无论是直接面向学生还是与合作伙伴共同推广。
代佩霖:我们公司的愿景是让每个孩子都能拥有一个 AI 老师。随着技术的发展,我们的产品也日益成熟。我们希望在未来一两年内,我们的产品能够走进千家万户,让更多家庭和孩子以普惠化的成本获得优质、个性化的教学。
谭美红:在未来一年内,我们希望能够借助 AI 的能力,为 B 端用户、C 端用户以及以老师和学校为主体的 B 端用户提供一整套系统的解决方案,帮助他们轻松、愉悦、高效地掌握流利的英语,而不仅仅是成为考试机器。
热门跟贴