用户吐槽minimax模型垃圾|minimax|代码|可靠性|模型垃圾|真实场景

今日，国外社交媒体上，有用户吐槽国产模型minimax的表现十分令人失望，甚至可以用垃圾来形容。

该用户表示：玩过openclaw的都知道minimax有多垃圾。

在评论区，引发了诸多网友对此的共鸣。有网友表示：MiniMax像是精神分裂，胡思乱想，胡说八道，它把代码看了，给出的答案都是似是而非。总之问完再问，都不能解决问题。这个可以说是中国AI model最垃圾的一個。

通过整理网络资料也不难发现，很多用户在使用MiniMax的确都存在着诸多类似的困惑。

首先，最常被提到的是“幻觉问题”，也就是俗称的“瞎编”。不少用户反映，MiniMax 在回答事实性问题时，经常会一本正经地给出错误信息，而且内容看起来还挺像那么回事。例如，它可能会编造不存在的论文、虚构历史事件细节等。如果不去核实，很容易被误导。虽然这一问题在各类大模型中普遍存在，但不少用户认为 MiniMax 在这方面的表现相对更严重。

其次是“复读机”现象。很多用户吐槽它的回答又长又重复，本来一句话可以说清楚的内容，它却反复换种说法来表达，导致整段回复显得冗长且信息密度不高。简单来说，就是“看起来说了很多，其实没多大信息量”。

第三个争议点来自安全问题，尤其是围绕其角色扮演产品 Talkie。在2024至2025年间，这款应用被曝出对未成年用户保护不足，同时在部分角色扮演场景中生成了不当内容，例如涉及暴力或情感操控等。此外，还有媒体报道称，一些青少年在与 AI 角色进行深度互动后出现心理问题。这一系列事件引起了监管机构的关注，也对 MiniMax 在海外的口碑造成了较大冲击。

在实际使用体验上，很多人还指出 MiniMax 的指令遵循能力不够稳定。比如，用户明确要求用表格输出、限制字数，或者进行角色扮演时，模型经常“听不进去”，要么不按格式来，要么中途“出戏”。一旦任务稍微复杂一些，比如包含多步骤要求，就容易出现漏步骤或顺序混乱的问题。

在推理能力方面，MiniMax 也常被拿来与更强的模型进行对比。无论是逻辑推理、数学问题还是代码调试，它在多步骤推理过程中容易出现中间出错的情况，一旦某一步偏了，后面的结果往往就全部错误。这使得整体可靠性受到影响。

此外，还有用户质疑其“跑分表现与实际体验不符”。也就是说，在官方公布的 Benchmark 测试中，模型成绩看起来很不错，但在真实使用场景中，表现却达不到预期。一些社区用户甚至怀疑模型针对测试集做了优化，不过这一点并没有确凿证据，但“体感落差”确实是普遍反馈。

比较有意思的是，尽管 MiniMax 是国产模型，但在中文理解上也并非完全稳定。例如，成语和歇后语偶尔会用错，对网络梗或双关语的理解也不总是准确，在涉及特定文化背景的内容时，有时也会出现偏差，这一点让部分用户感到意外。

最后，在多模态方面，其视频生成产品（如海螺 AI）也经历了“初看惊艳、细看翻车”的评价变化。用户在深入使用后发现，生成视频中常见人物一致性较差（同一角色前后长相变化明显）、物理规律不合理（如穿模、重力异常）以及可控性不足等问题，难以精确实现预期效果。

总体来看，MiniMax 的模型在技术展示层面具有一定亮点，但在稳定性、可靠性和实际使用体验上，仍存在不少被用户反复提及的短板。这些问题是否能够在后续版本中得到改善，也成为不少人持续关注的焦点。