公众号关注 “GitHubDaily”
设为 “星标”,每天带你逛 GitHub!
数学,可谓是解开宇宙万物本源最为重要的钥匙之一。
从早期人类通过结绳、刻字来计数,到后面算盘诞生,推动计算机的演化与发展,人类的数学能力一直在以指数级提升。
当计算机首次将人类花费数千年才能推算出的结果,打印在纸张上时,无数科学家脸上的震惊之色难以言表。
时至今日,这一棒交到了 AI 手上,虽说它进入公众视野只有短短几年,但这几步却走得颇为坎坷。
去年刚发布没多久的 ChatGPT,在基础数学逻辑上的推理,犯下了不少低级错误,以致于大家都开始怀疑,AI 是否真的能够凭借优秀的计算速度与推理能力,引领人类将数学能力到一个新的高度上。
所幸在这股 AI 时代浪潮之下,能人善士辈出,大家纷纷躬身入局,不断探索与挖掘 AI 的真正能力,这才让 AI 大模型的数学能力有了质的突破。
独角兽崛起
2023 年 3 月,一家专注于 AI 大模型研发的公司悄然成立,从初期的寥寥几万用户,到今天的几千万,他们只用了四百多天。
这家公司叫月之暗面,而这个大模型,便是众人所熟知的 Kimi。
AI 大模型的各种能力,诸如情感表达、知识检索、文案创作,都已是老生常谈的话题,在此便不再赘述。
今天,我想跟大家聊聊曾被视为 AI 最为薄弱的一项数学能力,在 Kimi 手上,被发挥到何种程度。
不久前,Kimi 推出了新一代k0-math数学模型,其综合能力与一众世界主流 AI 模型不遑多让。
在中考、高考、考研以及入门竞赛题 MATH 等 4 个数学基准测试中,更是超越了这些主流模型。
其中令我感到最有意思的一点,便是它引入了 “COT 思维链” 技术。
简单来说,就是让 AI 能像人脑一样,去思考每道题的解答步骤,并基于上下文一步步推导出最准确的结果。
下面就带大家感受一下,这个来自新时代 AI 模型的数学能力吧。
k0-math 的魔力
今天下班较早,刚打开电脑,打算把玩一下 Kimi 这个新上手的功能。
恰巧赶上侄女一家来做客,便想着带着这个对数学颇感兴趣的侄女(小颖),来测试一下 Kimi 的数学能力。
场景一:来个数学老师吧
小颖前两天的数学考试得了 95 分,只错了一道题,老师说是因为答题思路不明确,方向错误,才没得分。
那么,如果换成 Kimi,它会怎么做?
首先我们把题目传给 AI,并加入适当提示词,看它是怎么推理整个解题过程。
注意:这里我们需要先对题目截图,再用 Kimi 常规版将题目转为 LaTeX 格式,让模型更好理解公式。
瞬间 k0-math 给出了详细的解题步骤,一步步进行求解与验证。
(可以上下滚动查看完整回答过程)
发给小颖看了后,她瞬间焕然大悟。Kimi 过关。
场景二:整一个大蛋糕
为了庆祝小颖此次考试名次上升,大家提议整个蛋糕。
不过今天来的人比较多,用于蛋糕制作的面粉不够,这时候需要重新确定配比。
换做以往,得掏出计算器折腾半天,但今天这个计算工作,我想交给 Kimi。
于是,便有了如下跟 Kimi 的对话。
k0-math 的回答让我眼前一亮。它不仅能准确给出答案,还会根据实际生活情况来给出合理用量。
比如按照常识,我们使用的鸡蛋数必须为整数,这里 Kimi 并不会直接按结果建议用 7.5 个鸡蛋,而是会再次深入思考,意识到半个鸡蛋的不合理之处。
这里就需要 Kimi 来抉择少半个,还是多半个鸡蛋两种情况。
由于我们一开始的目的是做更大的蛋糕,因此在 Kimi 看来,蛋糕稍微大点,对于我们的需求来说,不会有太大影响,最终它很明智的推荐我们使用 8 个鸡蛋的份量。
(可以上下滚动查看完整回答过程)
场景三:摇骰子小游戏
在吃完蛋糕的茶余饭后之际,我看有点无聊,便提议来玩大话骰。
玩过的朋友应该知道,大话骰的决胜关键,在于推理出各个玩家手上的骰子出现概率,再报出最接近概率的骰子数,或用骗术来迷惑对手。
那么,这时如果让 Kimi 参加到这场游戏博弈,能否提高我的胜算呢?
想到这里,我便考虑亲自实践一番:
在充分理解游戏规则之后,Kimi 开始帮助我进行概率分析。
首先我的上家叫了「4 个 5」,论到我,这时我有以下几种选择:
因此为了抉择是质疑还是加注,我便可以先了解游戏场上,「4 个 5」会出现的概率。如果该概率较大,我便可以选择加注,概率较小,则质疑。
在我没有明确跟 Kimi 沟通决胜技巧的前提下,它竟然可以知道优先分析场上 5 和 6 出现的概率,再结合我手上现有的骰子,进行完整的逻辑分析,并得出令我胜算概率最大的选择。
整个推理过程没有人类情感,只有来自数学的理性。Kimi 每一个推理结果的产出,都化作我叫骰加注的勇气。
(可以上下滚动查看完整回答过程)
经过几轮游戏下来,我发现借助 Kimi 的推理之后,胜算确实大幅提升了。 不过在他们发现我用 Kimi 作弊之后,我就被禁止参赛了
短短几轮博弈,便让我体验到《决胜 21 点》主人公那种凭借出色数学天赋,宛如开挂般在赌场赢钱的爽劲。
通过以上几轮真实场景演示,相信大家除了直观感受到 k0-math 模型强大的数学推理能力之外,还能看到将其能力融入生活后,可带来的不同体验。
AI 成为私人教学导师,帮忙分析错题,一步步引导学生理解解题思路,让思维更加清晰。担任生活助手,解决生活中遇到的各种数学问题。还能在需要数学计算的游戏博弈中,帮助我们赢下游戏。
经过这短短几天的体验之后,我对 AI 大模型的数学能力有了新的认知。我也相信,在各位数学精英的把玩下,Kimi 的 k0-math 远不止于此。
人类对数学的探索历史,在每个时代都会涌现出那么几颗璀璨巨星,他们的出现,大幅推动了整个人类文明与科技的进步。
从古人开始用编绳计数,置换柴米油盐,交易日常所需。到今天用计算机推算火箭数据,帮助人类实现星辰大海的探索梦想。
这一切的一切,都源自于数学。这把从始至终都静默存在,等待人类去拾取的钥匙。
Kimi 近期发布的 k0-math 模型,让我又不禁思考,在未来的一百年内,AI 又会如何借助数学能力,把人类带到哪一个新的阶段呢?
大家一起拭目以待吧。
热门跟贴