学而思九章大模型通过中国信通院教育大模型评估

松果财经

2024-06-28 12:08 ·湖南 ·网易号科技内容作者

随着教育行业数字化转型、智能化升级呈现加速发展态势，教育大模型持续探索与教育各环节进行全面深度融合，全面赋能智能学习、智能教学、智能阅卷等各个核心场景。为推动产业健康持续发展，中国信息通信研究院（以下简称“中国信通院”）人工智能研究所联合业界单位共同编制了教育大模型标准。

近期，在中国信通院组织的首轮教育大模型评估中，学而思“九章大模型”顺利完成了教育大模型评估，获得4+级证书，成为国内首批通过该项评估并获得当前最高评级的企业。教育大模型评估依据《面向行业的大规模预训练模型技术和应用评估方法第3部分：教育大模型》标准，共计3个能力域，6个能力子域，30余个能力项。标准聚焦教育行业核心需求，形成教育大模型应用成熟度评价方法，便于各方衡量教育大模型的应用能效，助推教育大模型产品升级优化。

【学而思九章大模型介绍】

学而思九章大模型（MathGPT）是好未来自主研发的，以解题和讲题算法为核心的大模型。九章大模型具有四大核心功能，即数学学科的自动解题、复杂应用题的批改，语文英语的作文批改，个性化的AI分步骤讲题。大模型强大的生成、理解能力，既能针对性解决学生的个性化问题，从其不懂的题目映射出相应知识点，并加以补充讲解，使得学生融会贯通，又能在内置大量优质教学资源的同时，向更广泛的学生普及。

图1 学而思“九章大模型”界面

【评估介绍】

教育大模型评估指标覆盖场景丰富度、能力支持度、应用成熟度三大维度，在促进产业发展、提升技术影响力和服务规范等方面具有重要作用。

（1）场景丰富度：关注教育大模型产品覆盖广度，包括学科支持度（数学、语文、物理、化学等）、场景支持度（知识检索、知识问答、自主学习、测评考试等）；

（2）能力支持度：关注教育大模型任务支持度和性能优越度，包括计算、问答、分析、创作、总结等能力；

（3）应用成熟度：关注教育大模型安全性、学习性、启发性、记忆性等，包括服务多样性、服务成熟度两个维度。

图2 评估范围

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴