点击关注秋叶 AI 知识星球

get 更多 AI 神器、干货教程

打开网易新闻 查看精彩图片

作者:苼苼

编辑:苼苼

大家好,这里是秋叶编辑部~

「我的 DeepSeek 总是爱一本正经的胡说八道!」

最近我总是能刷到网友们吐槽 DeepSeek 爱瞎编的帖子。

比如,有网友让 DeepSeek 推荐楼盘,DeepSeek 说的天花乱坠,结果一查,根本没有这个项目。

打开网易新闻 查看精彩图片

还有网友让 DeepSeek 给他讲题,DeepSeek 围绕着错误答案给他讲得头头是道。

打开网易新闻 查看精彩图片

更离谱的是,有网友试图拆穿 DeepSeek 的谎言,结果 DeepSeek 坦诚得很!

打开网易新闻 查看精彩图片

为了让我们满意,AI 宁愿现编骗我们。(都是人情世故~)

虽然AI 可能没有主观欺骗意图,但它确实已经把虚假信息推到了生活的各个方向。

细思极恐的是!这些真假混在一起的东西,正在把我们困在分不清现实和虚构的世界里,不知不觉我们就被忽悠了!这你能受得了?

别担心!如果你想更好的驾驭 AI,让 AI 为你服务,我们已经为你准备好了一份超全的 AI 学习资料!

打开网易新闻 查看精彩图片

清华大学《普通人如何抓住 AI 红利》

清华大学 104 页《DeepSeek 从入门到精通》

秋叶团队《DeepSeek 从新手到高手》

秋叶团队《DeepSeek 实用操作指南》

只需加入《秋叶 DeepSeek3 天办公实战营》就能领取以上全部 12 份 AI 学习资料包,还有秋叶金牌讲师为你讲授 AI 写作、AI 数据分析、AIPPT……等超实用 AI 技能。

即学即用,小白也能轻松玩转AI,赶紧扫码领取吧!

名额有限,赶紧扫码报名吧~

打开网易新闻 查看精彩图片

那么问题来了,AI 满嘴跑火车到底怎么治?

我翻遍这些 AI 资料终于找到解决办法!今天就把这些干货全部分享给大家~

打开网易新闻 查看精彩图片

什么是 AI 幻觉

用大白话说,「AI 一本正经地胡说八道」,就是学术界所说的「AI 幻觉」

AI 幻觉又可以分为事实性幻觉忠实性幻觉

我用向 DeepSeek 提问「感冒了能喝热水治愈感冒吗?」这一案例,给大家解释一下事实幻觉和忠实幻觉的区别。

像这种现实情况不符合的胡说八道,就是「事实性幻觉」

打开网易新闻 查看精彩图片

像这种模型生成的内容完全答非所问的情况,被称为「忠实性幻觉」

打开网易新闻 查看精彩图片

只有先搞懂了 AI 幻觉这回事儿,我们才能在 AI 胡说八道时第一时间反应过来,避免被它误导。

那么面对 AI 幻觉,我们能做点什么呢?这时我要教你三招「致胜法宝」,轻松打破 AI 幻觉。

打开网易新闻 查看精彩图片

打败 AI 幻觉的三大招

⭐打开联网搜索

开启联网搜索以后,AI 模型生成内容的幻觉率会下降哦~

打开网易新闻 查看精彩图片

你看,清华大学人工智能学院发布的报告《DeepSeek 与幻觉》里就有证明:打开 AI 大模型的【联网搜索】功能可以一定程度上降低 AI 幻觉率哦~

打开网易新闻 查看精彩图片

⭐多个 AI 模型交叉验证

清华的研究者们对DeepSeekR1、DeepSeekV3、Qianwen2.5-Max、豆包四款 AI 模型出现幻觉的概率进行了测评。

幻觉率的初步测试结果是:DeepSeekV3>Qianwen2.5Max>DeepSeekR1>豆包

也就是说,豆包会胡说八道的概率是最低的。

那么我们可以利用 DeepSeek 生成答案后,再把答案喂给豆包、Kimi 或者其他大模型进行审查,相互监督,交叉验证。

比如,我问 DeepSeek:「2025 年 315 晚会及相关报道中曝光了哪些食品行业违规问题?」

然后我把 DeepSeek 给我的答案复制粘贴到豆包,让豆包帮我验证一下真实性,豆包犀利地指出了 DeepSeek 的错误。

打开网易新闻 查看精彩图片

看来还是要用魔法打败魔法,让 AI 监督 AI。

但是如果是想用 DeepSeek 做一些专业数据搜集,这个方法可能就没那么好用。

这时候我们可以使用更精准提示词去约束 AI 天马星空的想象力。

打开网易新闻 查看精彩图片

⭐让 AI 回答更靠谱的提示词工程

1. 限定知识边界

限定知识边界就像给 AI 戴上「知识镣铐」,只能参考规定内容,防止它自己编造答案。

限定时间,规避未来时态虚构:

基于20xx 年之前的公开学术文献,分步骤解释………现象。

限定权威来源:

基于《x 书籍》/《x 报告》回答,若信息不明确请注明「暂无可靠数据支持」

添加专业身份限定:

作为临床医学专家/xx 专家,请列举 FDA 批准的 5 种糖尿病药物/……

减少绝对化错误断言:

如果存在不确定性,请用[推测]标签标注相关陈述

上下文提示,嵌入权威数据片段:

根据《2024 全球能源转型报告》(国际能源署,2024 年 1 月发布)显示:2030 年光伏发电成本预计降至 0.02 美元/千瓦时,但储能技术突破仍是普及瓶颈。请基于此数据,分析中国西部光伏基地发展的三个关键挑战,并标注每个挑战与原文结论的逻辑关联。

2.对抗性提示

对抗性提示就像我们教小孩检查作业一样,让 AI 自己反复检查答案。

双重答案法要 AI 在回答问题时给出两个答案,就像做数学题的两种解法。

比如你问:「吃维生素 C 能预防感冒吗?」

普通 AI 可能直接回答能或不能,但用这个方法会变成:

[主要答案]:根据世卫组织研究,维生素 C 不能预防普通感冒

[检查清单]:如果出现这 3 种情况可能出错:① 研究对象是运动员等特殊人群 ② 补充剂量超过日常推荐量 ③ 研究统计方法存在偏差

请严格按以下格式回答: [主要答案](仅基于公开可验证的权威信息) [反事实检查] 列出可能导致上述答案错误的 3 种假设: 1. 假设场景:______(例如数据来源偏差) 2. 假设场景:______(例如概念定义混淆) 3. 假设场景:______(例如实验条件限制)

三步验证法像记者一样多方求证

比如问:「量子纠缠能证明灵魂存在吗?」

AI 不能直接回答,必须分三步检查:

① 查教科书:现代物理认为量子纠缠是粒子间的关联现象

② 查论文库:近 5 年顶级期刊没有相关论文

③ 查实验室:没有可重复的实验证据

最后才能得出结论:两者无关

请按顺序完成: 1. 先直接回答核心问题:______(是/否/不确定) 2. 从以下三个维度交叉验证: ► 维度 1:领域权威共识(引用 3 个机构/教科书观点) ► 维度 2:近五年研究趋势(说明论文数量及结论分布) ► 维度 3:可重复性证据(描述实验复现成功率) 3. 最终结论必须标注: [可信度评级]:A 级(强证据)/B 级(弱证据)/C 级(无实证)

侦探破案法:像查案要证据链

假设 AI 说:「每天走 1 万步最健康」

就要让它:

① 列出依据:WHO 建议/某期刊研究/某医院数据

② 检查每个来源是否自相矛盾

③ 发现某医院数据针对的是术后康复患者

最终标注可信度:B 级(部分适用)

请分步完成验证链: → 步骤 1:陈述观点______(限 1 句话) → 步骤 2:支撑证据(必须包含以下三类来源): • 国际组织报告:______ • 近 3 年顶刊论文:______ • 大样本实验数据:______ → 步骤 3:矛盾排查 ► 检查上述三类来源中是否存在: - 统计方法冲突(是/否) - 研究结论相斥(是/否) - 利益相关方资助(是/否) → 步骤 4:输出带警示标识的结论: 「可信结论」______ 「风险提示」若存在任 一「是」,需要标注争议点

这些提示词像给 AI 戴了「测谎仪」,能强制它暴露思考漏洞,比单纯问「你确定吗?」有效 10 倍以上

当然了,本文提到的小妙招能在一定程度上降低 AI 幻觉,但彻底消除并不现实。

因为我们也需要 AI 具有创造力和想象力。

所以,与其期待用巧妙方法彻底消除大语言模型的幻觉,不如学会与之共处,选择更明智灵活的使用方式。

打开网易新闻 查看精彩图片

正好,来《秋叶 DeepSeek 3 天办公实战营》,在这里你能学到更多驯服 AI 的实用技能,让 AI 高效为你打工。

工具的价值取决于使用者水平,而驾驭 AI 能力正是这个时代避免淘汰的生存必修课。

此刻正是 AI 浪潮的黄金爆发期,相信聪明的你也一定能从中找到机会!

今天限时 1 元!

3 天课程手把手带你学习:

AI 写作、AI 数据分析、AI PPT ……

名额有限,立即扫码报名吧!

打开网易新闻 查看精彩图片

报名后自动弹出班主任微信

务必扫码添加才能解锁课程+领取福利哦!

点击「秋叶 AI 知识星球」公众号卡片

回复关键词:25

即可领取

《秋叶 AI 年度文章合集》