数学推理能力超o1，kimi的数学推理模型它要来了！

AI先锋官

2024-11-17 22:26 ·北京

作者｜子川

来源｜AI先锋官

kimi的最新模型，它要来了！

在11月16号下午，也是Kimi面向全社会开放服务一周年之际，kimi宣布推出它们新一代数学推理模型 k0-math。

此次数学推理模型k0-math直接对标 OpenAI o1的 o1-mini 和 o1-preview 。

在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中，k0-math 初代模型取得的成绩已经完全超越 o1-mini 和 o1-preview 模型。具体数据如下图所示：

同时在两个难度更大的竞赛级别的数学题库OMNI-MATH 和 AIME 基准测试中， k0-math 初代模型的成绩分别达到了o1-mini 最高成绩的 90% 和 83%

k0-math在解数学题上会和目前市面上的模型有稍不同。不仅思考时间会更长，同时解题过程中会列出多种解题方法，最后反复验证，才会给出准确答案。

就像这样式的。

数学推理能力超o1，kimi的数学推理模型它要来了！

就连简单的1+1，它也会给出好几个解题过程，最后才会给出答案“1+1=2”。

同时k0-math 模型还不能解答 LaTeX 格式难以描述的几何图形类问题。

大家会喜欢这样准确性更高同时解题时间更长的交互吗？

除了发布 k0-math以外，Kimi 探索版也将上线更多具有推理能力的功能。

意图增强：将抽象的问题和模糊的概念具体化，去理解用户的真实需求。比如用户提问“某产品的用户忠实度”，Kimi 会把“用户忠诚度”这个模糊的问题转发为具体的“活跃度、留存率、使用频率和时长”等维度分析用户的忠实度。

信源分析：在搜索回答来源时，先会进行一轮筛选，筛选出更具权威性和可靠的信息源，并且可以在答案中一键定位信源具体的出处。

链式思考：基于 COT 思维链处理能力，对问题进行逐步的链式拆解。

比如：当营销人员在选择广告平台时，想要了解“有哪些社交媒体广告平台，哪个最有效”。

Kimi会首先拆解这个问题，列出主要的社交媒体广告平台，然后分别搜索每个平台的优势、用户群体和适用场景，最后分析整合这些高质量的信息，推荐一个最适合不同需求的广告平台及其理由。

k0-math模型和更强的Kimi探索版，未来几周就将分批陆续上线Kimi网页版和Kimi智能助手APP，大家可以浅浅期待一下。

扫码邀请进群，我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型，顺便学一些AI搞钱技能。

往期文章回顾

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴