今日,国外社交媒体上,有用户吐槽国产模型minimax的表现十分令人失望,甚至可以用垃圾来形容。

打开网易新闻 查看精彩图片

该用户表示:玩过openclaw的都知道minimax有多垃圾。

在评论区,引发了诸多网友对此的共鸣。有网友表示:MiniMax像是精神分裂,胡思乱想,胡说八道,它把代码看了,给出的答案都是似是而非。总之问完再问,都不能解决问题。这个可以说是中国AI model最垃圾的一個。

通过整理网络资料也不难发现,很多用户在使用MiniMax的确都存在着诸多类似的困惑。

首先,最常被提到的是“幻觉问题”,也就是俗称的“瞎编”。不少用户反映,MiniMax 在回答事实性问题时,经常会一本正经地给出错误信息,而且内容看起来还挺像那么回事。例如,它可能会编造不存在的论文、虚构历史事件细节等。如果不去核实,很容易被误导。虽然这一问题在各类大模型中普遍存在,但不少用户认为 MiniMax 在这方面的表现相对更严重。

其次是“复读机”现象。很多用户吐槽它的回答又长又重复,本来一句话可以说清楚的内容,它却反复换种说法来表达,导致整段回复显得冗长且信息密度不高。简单来说,就是“看起来说了很多,其实没多大信息量”。

第三个争议点来自安全问题,尤其是围绕其角色扮演产品 Talkie。在2024至2025年间,这款应用被曝出对未成年用户保护不足,同时在部分角色扮演场景中生成了不当内容,例如涉及暴力或情感操控等。此外,还有媒体报道称,一些青少年在与 AI 角色进行深度互动后出现心理问题。这一系列事件引起了监管机构的关注,也对 MiniMax 在海外的口碑造成了较大冲击。

在实际使用体验上,很多人还指出 MiniMax 的指令遵循能力不够稳定。比如,用户明确要求用表格输出、限制字数,或者进行角色扮演时,模型经常“听不进去”,要么不按格式来,要么中途“出戏”。一旦任务稍微复杂一些,比如包含多步骤要求,就容易出现漏步骤或顺序混乱的问题。

在推理能力方面,MiniMax 也常被拿来与更强的模型进行对比。无论是逻辑推理、数学问题还是代码调试,它在多步骤推理过程中容易出现中间出错的情况,一旦某一步偏了,后面的结果往往就全部错误。这使得整体可靠性受到影响。

此外,还有用户质疑其“跑分表现与实际体验不符”。也就是说,在官方公布的 Benchmark 测试中,模型成绩看起来很不错,但在真实使用场景中,表现却达不到预期。一些社区用户甚至怀疑模型针对测试集做了优化,不过这一点并没有确凿证据,但“体感落差”确实是普遍反馈。

比较有意思的是,尽管 MiniMax 是国产模型,但在中文理解上也并非完全稳定。例如,成语和歇后语偶尔会用错,对网络梗或双关语的理解也不总是准确,在涉及特定文化背景的内容时,有时也会出现偏差,这一点让部分用户感到意外。

最后,在多模态方面,其视频生成产品(如海螺 AI)也经历了“初看惊艳、细看翻车”的评价变化。用户在深入使用后发现,生成视频中常见人物一致性较差(同一角色前后长相变化明显)、物理规律不合理(如穿模、重力异常)以及可控性不足等问题,难以精确实现预期效果。

总体来看,MiniMax 的模型在技术展示层面具有一定亮点,但在稳定性、可靠性和实际使用体验上,仍存在不少被用户反复提及的短板。这些问题是否能够在后续版本中得到改善,也成为不少人持续关注的焦点。

延伸阅读:

minimax 大肆抄袭kimi!开发者本人吐槽后被光速踢出群聊,怒发律师函誓要刚到底

国产货真不行!龙虾用户吐槽 minimax 是个巨型垃圾,评论区排队点赞