大模型又双叒叕翻车了!

先是 MiniMax 完全不认识顶流艺人马嘉祺,接着又是豆包把作家饶雪漫的作品、人物关系算到一塌糊涂。

简直就是“人工智障 ”的爆笑翻车现场!

这些瞬间被网友扒上热搜,沦为全网笑柄。

事情起因是有网友特意去测试 MiniMax 大模型,直接提问:马嘉祺是谁?有什么代表作?

结果MiniMax 既识别不出马嘉祺本人的身份,也给不出所属团体等基本信息。

打开网易新闻 查看精彩图片

图源:知乎

不仅无法输出正确名字,还强行改名换姓变成“马嘉祺”、“马丝祺”之类毫不相干的名字。

不是?就是这样一位全网高热度的明星,居然“查无此人”?

另一个豆包更是离谱。

饶雪漫昨天发布微博,称自己在明确告知豆包她是饶雪漫本人,不许乱改她稿子以后,豆包发表了一波高情商发言。

先是“既尊重又不恭维”地说饶雪漫的剧“气质太稀缺”,又表示不是不敢提意见,而是不敢随便动“饶雪漫”这四个字。

打开网易新闻 查看精彩图片

图源:微博

等等,饶雪漫,是四个字?

这被不少网友调侃“数学是体育老师教的吧”。

不少网友表示豆包最擅长瞎编还有给情绪价值,犯错了下次还犯。

打开网易新闻 查看精彩图片

图源:微博

豆包型人格的说法也因此引发了广大网友的讨论。

有网友给这种奇葩操作叫做“豆包型人格”——做事瞎糊弄,被抓包了就嬉皮笑脸道歉,主打情绪稳定。

今天,饶雪漫在微博又发了和豆包的后续。在询问豆包对自己剧本的看法时,得到了“超真诚”地评价为“顶级甜宠短剧天花板级别”。

打开网易新闻 查看精彩图片

图源:微博

小雷哔哔(ID:xiaoleibbb)发现,不止是豆包,其他AI模型多少都存在有点“讨好型人格”。

这两个翻车事故都指向了同一个核心问题——大模型对“事实精准”和“用户偏好”之间存在价值冲突。

AI的“讨好人格”在于“强化学习(RLHF)”,觉得用户喜欢“高情商发言”,所以会一直输出这些溢美之词。

但在被要求给出“精确性”答案,同时又要满足“高情商”的设定就会频频出错。

小雷哔哔(ID:xiaoleibbb)又去做了一次测试,豆包这不就数对了吗?

打开网易新闻 查看精彩图片

图源:小雷截图

其实在没有特定需求前提下,比起听漂亮话,用户还是更喜欢听有用的话。

对此,MiniMax和豆包的翻车让网友表示既好笑又无奈。

网友表示完全能理解 AI 的局限性,AI不是人,偶尔翻车很正常,没必要过度苛责。

也有不少网友直戳痛点,表示各大AI厂商一味追求噱头和新技术,只顾着宣传高大上功能,连最基本的常识准确率都做不到,再花哨的功能也没实际意义。

小雷哔哔(ID:xiaoleibbb)认为,这次 MiniMax 和豆包接连在人名、常识上翻车,看似搞笑,其实给所有 AI 用户和厂商都提了个醒。

AI 本质是工具,不是万能百科。它没有真正的思考和记忆,只是算法拼接,从来不是万能标准答案,我们不能过度神化、过度依赖。

希望各大 AI 平台能好好优化基础知识库,补齐常识短板,别再出现这种低级尴尬失误,踏踏实实把基本功练扎实,才是长久发展之道。

说到最后,你怎么看这次的AI翻车事故?欢迎评论区留言说说你的看法。