AI幻觉是什么?为什么它会一本正经地说错话

2026-05-25 · 阅读 32 · 2372 字 · ⏱️ 预计7 分钟读完

老D,我最近用 ChatGPT 查资料,它居然给我推荐了一篇完全不存在的论文,作者、期刊、日期编得有模有样。这就是你们常说的 'AI 幻觉' 吧?它到底是怎么回事,为什么能这么自信地胡说?

没错,这就是典型的 AI 幻觉(hallucination)。AI 幻觉不是它故意骗你,而是它觉得自己真的在认真回答——因为大语言模型的工作原理压根不是查询数据库,而是“接龙游戏”。

打个比方:你问它“李白写过《静夜思》吗?”,它没去翻书,也没搜索记忆,而是根据训练时见过的海量文本,算出一个概率最高的答案序列。如果训练数据里“李白”和“静夜思”总挨在一起,它就会很自信地吐出“床前明月光...”。但你要是问“请列举 5 篇 2023 年关于量子计算的顶会论文”,它可能根本没记住真正的标题,却会根据格式套路“编”出像模像样的作者名、期刊名,因为它的目标只是让句子读起来通顺合理,而不是保证事实正确。说白了,它是个超级会写作文的文科生,不是个严谨的理科生。

很多人以为 AI 背后有一个巨大的知识图谱在做实时验证,其实它只有一个神经网络在根据前文预测下一个字。你这次遇上的编造论文就是典型——它把论文的格式学得炉火纯青,但内容全是概率抽奖抽出来的。

等等,那为什么它有时候又能给出很准确的事实?像我让它算一个三角形面积,它就能给出公式和正确答案。如果完全是“接龙”,准确率应该靠运气啊?

你问到点子上了。这恰恰是多数人的误区——AI 的回答有时正确,是因为训练数据里那些知识重复了足够多次,概率分布很集中,不是因为它理解了真理。三角形面积公式在网络上出现得太高频了,几乎所有相关下一页页的概率都指向同一个答案。但当你问一个冷门领域的假新闻是真是假时,它可能根本没在数据里见过真相,却会因为问题里带着“假新闻”“辟谣”等关联词,而顺着“辟谣体”生成一篇看似合理的分析,实则通篇鬼扯。

再说个生活类比:就像你把一只鹦鹉放在新闻编辑部,它天天听记者念稿,最后能学出“据外交部消息……”的腔调,但如果你问它今天外交部真说了啥,它可能现编一段冠冕堂皇的废话,口音还很像那么回事。AI 就是这只鹦鹉——它学会了语言的形式,却没学会事实与虚构的边界

听你这么一说,我感觉特别慌。那我用 AI 查法律条款、医疗建议的话,不是很容易踩坑?有没有哪些场景特别危险?

确实,幻觉在几个场景堪称“高危雷区”,我给你列个表感受一下:

高风险场景典型幻觉表现真实案例/危害
法律条文、判决捏造法条编号、虚构判例曾有律师用 ChatGPT 准备法庭文件,引用不存在的判例,被法官严厉警告。
医疗诊断、用药推荐不存在的疗法、错误剂量有人因听从 AI 建议混合用药导致肝损伤,而 AI 声称该方案“在《柳叶刀》上有论文支持”,实则子虚乌有。
精确数字、统计编造看似精确的百分比、收入数据问“2022年中国城镇调查失业率”,它可能给你4.8%这种像模像样但查无实据的数字。
学术引文、专利虚构作者、期刊、DOI号你亲身经历的假论文就是典型,DOI格式都对,但根本指向空网页。

这些领域的共同点是:答案有唯一标准,且后果严重。而 AI 最擅长把不确定的东西包装得确定无疑,危险就在这儿。

那我之前理解错了,以为越是专业的问题,AI 越应该谨慎……看来正好相反。那咱们普通人用 AI 怎么防坑?我总不能每次问完都再自己去翻论文吧,那还要 AI 干嘛?

好问题。我来分享三个实测有效的验证技巧,不用变专家也能避掉大部分幻觉:

  1. “左右互搏”交叉验证:把同一个问题分别丢给两个不同的 AI 模型(比如 ChatGPTClaude),然后对比答案。如果关键事实一致,可信度就高;如果各执一词,那大概率有人产生了幻觉。这相当于让两个目击者背对背对质。
  2. 追问来源,逼它自证:直接问“这个信息的具体出处是哪里?能给我链接吗?”如果它回答“对不起,我无法提供实时链接”或者给出一个打不开的链接,那就要高度怀疑。有时它甚至会当场认错,说“我前一条回答有误”。
  3. 限定权威域,缩小猜测空间:提问时加上像“请根据中国卫健委官网的信息回答”或“只参考《民法典》条文回答”,这能把它的预测范围限制在相对可靠的数据片段里,幻觉率会显著下降。很多工具现在支持“基于搜索回答”,原理类似。

这几个方法不保证百分百避坑,但把地雷排除七八成没问题。关键是形成一个习惯:把它当实习生,不把它当专家

🔄 那如果我以后用上 RAG 这类技术,是不是就能彻底解决幻觉?我听说 RAG 就是让 AI 先去查资料再回答。

你提的这个方向很内行。RAG(检索增强生成)确实能把事实性大幅提高,就像让那个鹦鹉抄着稿子念,而不是凭空瞎编。但它不是银弹——如果它检索到的资料本身就过时、有误,或者检索本身漏掉了关键文档,那么幻觉照样会出现。只是从“闭卷瞎蒙”变成了“开卷但可能翻错页”。目前还没有任何技术能根治 AI 幻觉,因为大模型的生成本质决定了它永远带着概率的不确定性。

所以,即便未来用上最新版的 NotebookLMPerplexity,我那三个技巧依然适用。

明白了,所以最靠谱的还是自己的判断力。最后我想记一句口诀回去给团队科普——🔑 一句话记住:AI 的输出是高级语言接龙,不是事实审计,把它的每句肯定都当“可能”,而不是“一定”。 延伸一个疑问:有没有什么工具能自动检测 AI 幻觉,比如给答案打分之类的?

总结到位!关于自动检测,现在有一些事实性评估工具,比如 TruthfulQAGiskard 可以给 AI 答案做幻觉评分,还有 LangChain 的链式校验 等开发工具。但这些工具本身也有准确率问题,目前只能作为辅助,无法替代人工复核。建议团队内部用 AI 出文案时,加一道“来源标注”环节,哪怕只是粗标信息出处,也能极大降低翻车率。