导语:7月26日,对教育科技行业,是非常重要的一天。

有道召开大模型成果发布会,主题“Powered by 子曰”,一口气发布了六款应用,获得众多好评,现场每两分钟响起一次掌声就是印证。

桃李参与了「虚拟人口语老师」的内测,几乎达到了80%真人外教的功能和体验,着实令人惊艳。

这是教育大模型真正意义上的第一次应用落地,上一回这样的Amazing感,还得追溯到2013年的双师课堂。

对于行业来说,其实只关心两个问题:其一,大模型在教育行业落地的价值究竟有多大;其二,有道好未来科大讯飞谁会成为大模型领跑者?且听桃李独家视角解读。

一口气发布六款落地应用

拿自己主业动刀

打开网易新闻 查看精彩图片

一场发布会,有道一口气发布了六款应用,分别是:

——“LLM翻译”、“虚拟人口语教练”、“AI作文指导”、“语法精讲”、“AI Box”以及“文档问答”。

外行人,一定会觉得有道疯了,要落地就落地,干嘛发布那么多产品,不同的角色代入,对大模型的理解不同。

· 有一部分纯互联网人嗨的是,终于出现一个通用工具,充满无与伦比的想象力,超级平台的概率虽然低微,但总归是值得赌一把的;

· 懂业务的人嗨的是,曾经幻想的行业改造,终于可以更好实现了,每个产业都值得用大模型重做一遍,有机会弯道超车。

尤其教育人,根本不会Care太多概念,他们更专注于应用场景,是不是真的有用,教育场景多元丰富,作文口语翻译文档等,其实是完全不同的需求锚点。

相比于通用大模型,“子曰”从一开始就定位为是一个“场景为先”的教育垂类大模型。它能够作为基座模型支持诸多下游任务,向所有下游场景提供语义理解、知识表达等基础能力,并为不同学习场景设计了定制化的模型,以实现模型与场景的高度契合。

有道CEO周枫也一直在强调“场景拉动”的重要性,他表示,“一个好的技术有没有价值、能不能发挥巨大的作用,很多时候关键在场景和应用的选择,以及细节的打磨。”

除了量大,还有一个特别重要的信号。

这几款应用接下来会直接安装到有道词典、有道词典笔、有道学习机上,成为软硬件生态的一部分。

其中,翻译是有道的主业,有道词典月活用户有1亿,是国内词典市场绝对的NO.1。都已经第一了还主动去改底层逻辑,从神经网络AI翻译升级到大模型AI翻译。

连自己的家底子都敢动刀,丝毫不留【灰度空间】,一定是看见大模型的价场景值,认为如果自己不革自己的命,就会被别人革命。

除6款应用之外,官方通告,棋类教育类、编程教育类、智慧体育类等等,都在展开探索。给大家翻译翻译,就是想基于「子曰大模型」,干教育垂类的操作系统了。

这个动机没啥问题,只能说,它符合技术落地过程中需要商业化验证的客观规律,能不能干成,仍需时间验证。

虚拟人口语老师S级惊艳

商业想象力可观

六款应用中,最为瞩目的便是英语口语练习神器——虚拟人口语教练Hi Echo。

桃李提前参与了内测,几乎满足了对数字人老师的80%想象,在连线对话的一瞬间,觉得非常Amazing,传说中的一对一个性化教学,就这样已经实现了?!

打开网易新闻 查看精彩图片

有几个特点:

· 能像真人老师一样跟对话者互动,表情生动,发音也地道;

· 突破了死板的剧本式交流,贴近真实的口语练习环境;

· 会真实地对你说的内容进行反馈,前后有连贯性;

· 尤其是,针对中式英语做了很多优化,我这夹杂河南湖北的混合口音,识别率准确率也是相当高的;

不用想,肯定是社恐的福音;

真正的大招是,每段对话后,立马生成【完整对话报告】,从单词、发音、语法三个维度给出分数,以及优化润色建议,学习感爆棚(不干五年以上教育的产品经理,是做不出这种手感的)。

发布会现场,进行了多组真人随机对话,Echo能迅速理解场景和上下文,并给出迅速反馈;她的面部表情和口型生动而自然,发音也非常地道,重音、弱读、升降调等细节处理得非常到位,现场观众纷纷赞叹。

产品仍有优化空间,但确实是新物种,而且有不可估量的商业价值。

单就这一款产品,即使VIPKID还活得好好的,也会有很强的危机感,巅峰时期的KID近10万外教老师,壁垒之深一度让大家觉得不可攻破。

可是在技术代差面前,万这个单位,不过是代码的近乎零边际成本复制而已,这种商业效能太可怕了。

等于说,外教基本被替代了,农村乡镇县城少年也能学最纯正英语了,教学资源可以均衡了,几亿人都有自己的专属口语老师,全国70万外语老师都有了新的辅助工具……

以上这些,都不能用古典VC逻辑来定义了,只能看二级市场的长周期反应。

为什么是有道?

实际场景驱动:用新技术解决旧问题

为什么是有道,做成教育行业首个垂直大模型?并率先实现应用落地?

这个问题很复杂,要拆解三层来回答。

第一层:AI底子被低估了。

· 从2016年开始,有道协同构建AI基础能力。同步组建语言、视觉、声音等团队,积累了有道神经网络翻译、计算机视觉、智能语音、高性能计算四大底层技术能力;

· 2017年,有道就与主流技术Transformer“双向奔赴”,将AI能力统一在大模型之下,尤其重视在端侧的落地应用,两年后有道词典笔2代首次搭载离线TransformerNMT;

· 2022年,有道词典笔P5中搭载了自研的离线ASR,也已升级为Transformer技术。

底层技术不断革新的同时,有道还在不断研发细分场景下的“黑科技”。如虚拟人口语教练实现语音识别能力、虚拟人驱动技术和内容生成和对话能力等多项技术能力的突破。

这些都是硬功夫投入的,非一朝一夕。

第二层:这半年稳扎稳打。

· 3月,有道宣布将推出“子曰”;

· 5月,首次剧透“AI口语老师”视频,有一波小刷屏;

· 7月,亮相世界人工智能大会,参与制定某行业标准;

站在交叉路口的人,对方向最敏感。

有道从一开始就明确做垂类模型,专注教育场景,没有盲目去烧钱,浪费子弹;产品和研发进度连贯,团队节奏感稳定。

懂技术又懂业务的老板,横轴能看见技术路径,纵轴能看见落地场景,两边都大致清晰,又没那么多束缚。

据说,周枫已经Focus半年多,“子曰”大模型是内部最重要的项目,每半天盯一次研发进度。

第三层:用新技术解决旧问题。

有道历史上三次主业变迁。

· 第一次:2006年,从主攻搜索引擎转做词典工具;

· 第二次:2018年,由教育工具转向聚焦K12在线教育;

· 第三次:2021年“双减”后,发力智能硬件业务。

这家公司很习惯在高速上换轮胎,每次转型,还都上了一个台阶。

对于大模型,有道是客观冷静的,不是为了做而做,所有的出发点都是业务驱动,能够对教育场景进行升级改造,能够更好地实现教学效果。

用新技术解决旧问题,挺务实的。

总结:

相比互联网公司,更懂教育;相比教育公司,更懂AI;相比其它教育科技公司,步步为营做得更扎实。

【04】

第一个大模型落地

对于教育行业究竟意味什么?

对于教育行业来说,大模型意味着什么?

· 一人一位全科老师;

· 终身学习成为现实;

· 个性化学习不是空谈;

· 教育全生命周期数字化有了载体;

· 十万亿级的新生产力释放;

· 人人公平的教育梦;

大半年前,Open AI用海量语料和大规模参数,“砸”出了ChatGPT,让所有人看到个性化教育甚至1对1教育希望之光。

短短几个月,国产「子曰」就将这个进程,推进到实战实用阶段,而且赋予了大模型更具象的产业意义。

周枫在发布会上表示:“之所以叫‘子曰’,是因为孔子是我国的教育先贤,又是因材施教教育理念的奠基者。‘夫子教人,各因其材’,我们希望可以朝着这样的教育理想去做。”

子曰大模型“因材施教”有三个优势。

首先,大模型能为学生提供个性化的分析和指导;其次,大模型能够实现引导式学习,与教师一样,提出问题并引导学生自行探索答案;最后,大模型具备全科知识整合能力,通过连接多模态知识库、跨学科整合知识内容,随时满足学生的动态需求,帮助孩子培养更综合的能力。

这将为学习者带来新的学习体验,为教学者提供新的赋能工具,从双师课堂开始,个性化的一人一师、普惠公平的教育梦想,有可能推进一大步。

目前来看,有三家教育大模型最有机会胜出,除了有道子曰,还有科大讯飞的星火认知,属于通用大模型在垂类的应用,技术实力很强;学而思自研的数学大模型MathGPT,虽然还未推出成品,但其对教育的理解是深刻的。

有道有没有机会,成为新一轮的领跑者,还不确定,不过行业里有这样一条鲶鱼创新挺好的。

大幕开始,持续跟踪。

【05】

桃李财经的思考

不能用旧思维观察新物种

当时代的浪,打到你身上的时候,往往会有一种虚空感,要好一阵子才能反应过来。

这半年被GPT各种轰炸,大家早就麻木了,默认把它当做一二级市场的一个喇叭工具。荒诞背后,鱼龙混杂,有人假信,有人真信,有人假做,有人真做。

冥冥之中,好像有一种巧合,GPT、数字人、Web3.0、产业互联网,这些新词,一定会在某个点交汇。

也许,当产品呈现在你面前的时候,你甚至会骂一句,什么玩意儿,这东西有人用吗?都是骗子吧?但把时间轴拉长来看,传说中的革命,事实上已经开始了,只是,你还在用旧思维看新物种。

目前,【Hi Echo】还在内测,据说会在开学季正式上线。强烈推荐,到时候下载感受一下,一个活生生的数字人老师,在你眼前跟你一对一对话,非常有触电的感觉。

这次,是个质变。

来源:桃李财经(公众号xiaozhangcaijing)