AI总是胡说怎么办?5个减少幻觉的实用技巧

2026-05-30 · 阅读 21 · 2140 字 · ⏱️ 预计7 分钟读完

老D,我最近用AI帮忙查资料写竞品分析文档,它经常给一些看起来特别像那么回事的数据,比如某个功能的上线时间、市场份额,但我一搜原文根本找不到,是不是这就是你们常说的“幻觉”?怎么才能让它少胡说?

对,这就是经典的AI幻觉——模型自信满满地编造不存在的事实,听起来还头头是道。说白了,这就像考前没复习的学渣,被拉去答题,只好现场发挥全凭印象瞎写。因为大模型不是数据库,它本质是根据概率续写句子,遇到记忆模糊或不知道的细节,就会“脑补”一个看起来合理的答案。

第一个技巧就很硬核:让AI引用来源,而且指定要真实可查的链接或文献。比如:“请给出你回答的依据,并附上可访问的URL或DOI”。很多产品如Perplexity、Kimi K3都内置了联网搜索,结果里会直接标出处。用GPT-5.5或者Claude Opus 4.7的时候,你也可以在提示词里要求“请用联网功能,并标注每一条信息的来源”。但要注意,有时它给出的引用也是瞎编的,尤其是要求引学术论文的时候——它可能把真实的作者、刊物混搭出一个不存在的文献,这个坑我踩过,所以下一步得验证。

等等,那如果它连引用都是编的,这个技巧不就失效了?我之前还真被它胡编的论文标题骗过一次。

你问到痛点了,很多人以为让AI加引用就万事大吉,其实它们照样能在引用里夹带私货。所以才有第二个技巧:教会AI表达不确定。在提示词里直接加一句:“如果你对某个细节不确定,就告诉我你不确定,不要猜测。”这有点像你向路人问路,诚实的人会说“抱歉我不清楚”,而不是乱指一条路。模型一旦被允许说“不知道”,它编造的概率会大幅下降。

具体做法:开头先设定人设:“你是一个严谨的研究助理,对于无法查证的信息必须明确标注[不确定],并说明原因。”这样它在回复里就会自己划出有把握和没把握的部分,你一看就知道哪里该自己复查。实测下来,越是给模型“诚实”的许可,它越不会硬撑。

但有些问题很复杂,比如让它分析一个业务决策,它不是一句“不确定”就完事了,我总不能让它啥都不说吧。有办法让它思考得更靠谱吗?

有,这就引出了第三个技巧:分步骤思考,并给它一份检查清单。打个比方,你让实习生写方案,直接说“写个报告”他可能胡乱抄模板,但如果你说“先列出三个关键假设,再逐一分析,最后给出结论,中途如果遇到数据缺失请标出”,质量立马不一样。

操作上可以分为两步:

  1. 在提示词里要求模型“先一步步推理,每一步验证后再继续,不要跳过中间步骤”。这其实是强迫模型激活它的推理链,现在很多模型比如DeepSeek R2、Claude 4.7 Thinking本身就是推理型,天生会多步思考;即便用普通模型,也能通过“你逐步想,先列大纲,再逐点分析”的指令诱发类似效果。
  2. 给它一个自检清单:“回答前请检查以下三点:①所有数据是否有公开来源?②逻辑是否有跳跃?③有没有未经证实的假设?”让模型自己打完草稿再交卷,幻觉得到明显压制。
那如果我同时用好几个模型问同一个问题,是不是能互相纠错?比如发现A答的和B答的细节对不上,我就知道可能有问题。

没错,这就是第四个技巧:对比多模型,尤其是不同架构或不同训练数据的模型。比如把Gemini 3 Ultra和DeepSeek V4的回答放在一起看,幻觉重合度会大大降低。因为各家模型的知识和“幻觉惯性”不完全一样,某个模型津津乐道的事件可能是另一个模型完全没学过的,一对比就露馅。不过要注意,如果它们都从同一批错误网络资料里学到同一个谣言,还是会一起犯错,所以别把交叉验证当绝对真理。

这里还得补一个重要原则:有些任务压根不能信AI,这是第五个技巧——人工验证底线。具体来说:

  • 医疗建议、法律条款、投资决策:AI的答案必须零信任,一定要找专业人士核对。
  • 涉及精确数字、日期、人名的内容:AI经常在这一类上翻车,因为概率模型天生不擅长死记硬背唯一正确答案。
  • 你给AI喂的内部数据,它也照样可能张冠李戴,重要文档生成后一定得人工过一遍。

我见过最惨的案例是有人直接用AI写的股权协议,结果连公司名称都编错了,还好没签字。这种事就不是技巧能兜底的了,得靠流程。

我悟了,总结一下就是:我得把AI当成一个脑子快但爱吹牛的新人同事,要让它拿证据(引用来源)、允许它说不知道(表达不确定)、逼它写解题步骤(分步思考+清单)、多找几个同事对质(多模型交叉),最关键的是——生死攸关的事不能放手。🔑 一句话记住:把AI当聪明但不可靠的实习生,用流程拴住它的嘴,而不是指望它变老实。对了,有没有那种可以一键帮我做事实核查的工具?

你这个“新人同事”的比喻比我的学渣比喻还贴切。事实核查工具目前还没有全自动的银弹,但可以组合使用:联网搜索类产品如Perplexity会自动标注源链接,你点开链接肉眼核对;另外有些写作辅助工具如Notion AI内置AI建议但保留人工审阅模式。更底层的办法是,把AI生成的结论拆成单个事实点,逐个扔回Google或搜索引擎搜一次——这招虽然笨但最管用。如果你对某个领域特别不放心,可以来小白学院的模型排行榜看看各模型事实性的评测分数,选幻觉率低的模型处理关键任务。最后,定期做一下我们的AI段位测评也不错,里面有不少关于安全使用AI的情景题,帮你保持警惕。