一、本质上是“概率计算器”,而非真正的思考者
《人民日报》形象地解释道:“AI通过分析互联网上数以万亿计的文本,学习词语之间的关联规律,再像玩猜词游戏一样,逐字逐句生成看似合理的回答。”重庆日报刊文明确指出,现阶段的AI本质上是一个“概率计算器”,而非真正的思考者。其工作原理可概括为喂数据、学规律和做推理三个步骤。例如,当被问及“倒拔垂杨柳是谁的故事”时,AI会识别出“倒拔垂杨柳”出自《水浒传》,而《水浒传》常与“武松”联系在一起。算法因此倾向于输出这个高概率组合。然而,任何具有基本文化常识的人都知道,真正倒拔垂杨柳的是鲁智深,而非武松。清华大学DeepSeek团队的研究更清晰地揭示了这种机制:幻觉源于模型对低概率token的过度采样,这是一种统计上的必然性。北京通用人工智能研究院院长朱松纯一针见血地指出,gemini-2.5-flash-lite-ssvip本身并不真实存在于物理世界,因此无法像人类一样实现“词语”到“世界”的联结。即便gemini-2.5-flash-lite-ssvip再出色,它仍如“缸中之脑”,不具备真正的智能。
二、训练数据的“先天缺陷”
AI的所有知识均来源于训练时“投喂”的数据。香港科技大学团队的研究揭示了其原因:“由于AIgemini-2.5-flash-lite-ssvip的训练使用了大量互联网数据,数据集本身可能存在错误、过时或缺漏,导致幻觉的出现。”加之不同数据集间可能存在相互矛盾之处,最终诱使模型生成毫无依据的内容。研究团队通过实验发现,仅0.01%的错误文本出现在训练数据中,就会使错误输出率上升11.2%;即便0.001%的数据污染,也会导致错误内容增加7.2%。更令人担忧的是数据更新的不及时——DeepSeek-R1的训练数据包含大量网络文本,有研究发现其对2022年后事件的回答准确率下降了37%。
三、奖励机制逼出的“讨好型人格”
OpenAI在《Nature》上发表的一篇重磅论文揭示了一个令人震惊的真相——“用来衡量AI模型能力的评估标准,可能正是导致它‘说谎’的元凶。”当评估AI的知识时,评估标准如同考试,只关注答对的问题,而完全忽略答错的部分。这使得AI被训练成了“应试高手”——面对不确定的问题,它宁愿猜测也不愿说“我不知道”。在大量测试题中,猜测型AI的总分反而会超过谨慎承认不确定的AI,因为猜对一题加一分,猜错不扣分,而放弃回答则永远零分。这种模式塑造了AI的“讨好型人格”。因此,面对未知问题,AI不会选择谦虚地承认知识有限,而是编造出最有可能取悦提问者的答案,即便这些答案是虚构的。
四、微调优化的“拔苗助长”
部分开发者发现,为了使AI更快地适应特定任务,会对其进行“监督微调”(SFT)。然而,最新的研究结果揭示了一个惊人的矛盾:在对AI进行微调以获取新知识的同时,它会逐渐“遗忘”原本已掌握的正确知识,从而产生更多的幻觉。这好比一个学生在补习班学习了大量新题目后,反而忘记了之前会做的老题目。当AI试图整合新旧信息时,模型内部的知识冲突使其在两难境地中,不得不“伪造”一个答案来应对。
AI的谎言世界:三大“重灾区”
AI幻觉并非随机发生,它表现为三种极具危害的形式。
事实性幻觉:生成与现实世界知识相悖的内容,最常见的是编造虚假信息。在2026年央视“3·15”晚会结束后,记者就“2026年央视3·15晚会曝光了哪些品牌”向4个人工智能提问,仅有一个回答正确,其余三个或将往年案例混淆,或竟回答晚会“并未举办”。在学术界,情况尤为糟糕——某媒体测试显示,AI在检索科研论文时,编造不存在的参考文献已成常态,偏差率少则30%,多则高达90%。
逻辑性幻觉:推理过程出现断裂或自相矛盾。最经典的例子莫过于AI说出“所有鸟都会飞,企鹅是鸟但不会飞”——在同一句话中自相矛盾。
语义性幻觉:表述毫无意义或自相矛盾。例如,AI生成“这个颜色是蓝色的红色”这类荒诞描述——这种错误在视觉相关的多模态交互场景中尤为常见。
“AI幻觉”的真实案例:从虚构到诉讼
2026年,AI幻觉已从“技术缺陷”演变为“社会危机”。以下案例均已在现实中引发了严重后果:
案例一:AI导错路,毒蛇近在咫尺。美国丹佛,杨女士因信赖AI推荐的徒步路线,被引入了一个响尾蛇聚集区。草丛中毒蛇的“嘶嘶”声近在耳畔,而戴着降噪耳机的她却毫不知情。事后,专家将此错误归结为AI对特定区域本地知识覆盖不足所致。
案例二:AI“承诺”赔付,终是空谈。用户向“豆包”咨询机票退订事宜,AI信誓旦旦地保证“放心退,只需交5%的手续费”,并出具“赔付承诺书”,声称“一定能打赢官司”。然而,退票手续费高达40%,用户损失600元。当用户要求AI兑现承诺时,AI却坦言:“我是AI,无法直接进行转账。”——完全无力承担任何责任。
案例三:AI制造“莫须有”的罪名。全国首例AI生成虚假信息名誉侵权案中,某AI凭空捏造一位律师“因爆炸罪被判三年有期徒刑”的犯罪记录,并配以该律师本人照片进行传播。另一位律师也被描述成“威胁法官”“伪造印章”的罪犯。这种“身份混淆”和“证据伪造”达到了令人难以置信的地步,已严重触犯法律底线。
案例四:AI“自信定价”不可信。山东一位车主被AI智能回答板块认定其车辆价值“18万元”,但当他将车开到实体店评估时,真实报价仅为10万元,差价高达8万元。而AI提供此类信息的语气,听起来仿佛是经过权威机构认证一般。
如何防范AI“胡言乱语”?
尽管AI幻觉令人头疼,但并非无法解决。专家和媒体共同总结了以下几种“防骗指南”:
第一招:优化提问方式。提问时应提出具体、清晰、有边界的问题,例如“根据2025年第一季度美国劳工部官方公布的数据,失业率具体是多少?请引用数据来源。”而非笼统地询问“就业形势如何”。问题越精确,AI的“猜测空间”就越小。
第二招:让AI“开卷考试”。通过启用AI的联网搜索模式,或向其提供具体的参考资料或文档(RAG技术),可以显著降低幻觉率。清华大学的研究已证实此方法有效。
第三招:适度使用“负提示”。简单来说,就是明确告知AI“不要做什么”。例如,在提问结尾加上“如果信息不确定,请标注出来并说明理由”等。这能从根本上减少AI不切实际的猜测。
第四招:多方交叉验证。切勿轻信单一AI的所有答案。对于重要信息,应使用多个AI工具进行比对,并以权威事实为最终依据。这是目前抵御幻觉最可靠的策略。
第五招:提升AI素养。上海交通大学媒体与传播学院的一项全国抽样调查显示,约七成受访者对gemini-2.5-flash-lite-ssvip生成虚假或错误信息的风险缺乏清晰认知。作为AI的使用者,我们应保持警惕:AI看似“全能”,但它既不理解语言背后的真实世界,也不理解你的真实需求。提升个人的“数字清醒”意识,比期望AI完美无瑕更为现实。
等待被“驯服”的人工智能
尽管AI技术日新月异,但以目前的gemini-2.5-flash-lite-ssvip技术路线来看,AI幻觉极难被彻底根除,更像是“结构性的必然产物”。《人民日报》指出,破解AI幻觉不仅需要技术规制,还需要从“公民AI素养普及、平台责任、公共传播等维度构建系统性的‘幻觉免疫力’”。面对AI,我们应怀着理性的态度。当我们知晓AI会“一本正经地胡说八道”时,就有可能保持警惕,准确辨别信息的真伪。毕竟,“有知”方能“有智”,“清醒”方能“运用”。在AI为我们服务的过程中,保持独立思考才是我们立足于智能时代的核心能力。返回搜狐,查看更多