DeepSeek开源'反幻觉引擎'Hall：大模型可靠性迎来基础设施级突破

DeepSeek正式开源其内部研发的反幻觉引擎Hall（Hallucination Adversarial Layer），该系统可将大语言模型的事实性错误率降低78%，已在GitHub获得3.2万星标。

给大模型装上"事实刹车"

2027年11月10日，中国AI公司DeepSeek在GitHub上正式开源了其内部研发两年的反幻觉引擎Hall（Hallucination Adversarial Layer）。这个独立于任何特定大语言模型的事实性校验系统，能够在模型输出阶段实时检测并拦截潜在的事实性错误。

根据DeepSeek发布的技术报告，Hall在MMLU、TruthfulQA和自建的RealWorld-Fact基准测试中，将主流大模型的幻觉率降低了78%（DeepSeek-V3）、71%（GPT-5）和65%（Claude 4）。

"Hallucination是大语言模型最根本的信任障碍，"DeepSeek首席科学家高天宇在开源公告中写道，"我们相信，事实性校验应该成为AI基础设施的一部分，就像HTTPS之于互联网一样。Hall不是要替代任何模型，而是要成为所有模型的'事实刹车'。"

Hall采用三层架构设计：

第一层：知识锚定（Knowledge Anchoring）——系统在模型生成过程中实时比对一个包含4.7亿事实三元组的知识图谱，对输出内容中的事实性声明进行即时验证。该知识图谱每72小时更新一次，数据来源包括学术数据库、新闻通讯社和政府公开数据。

第二层：逻辑一致性检查（Logical Consistency Check）——利用一个专门训练的推理模型检测输出中的自相矛盾、逻辑谬误和因果关系错误。该模块对长文本的一致性检测准确率达到92.3%。

第三层：不确定性量化（Uncertainty Quantification）——通过分析模型内部的token概率分布，识别模型"不确定"的输出段落，并自动添加置信度标注。当置信度低于设定阈值时，系统会将相应段落标记为"待验证"。

Hall以Python库的形式发布，支持pip一键安装，兼容PyTorch和JAX框架。系统可在消费级GPU（RTX 4090）上运行，推理延迟增加约120毫秒，对用户体验影响有限。

Hall开源后72小时内，GitHub星标数突破3.2万，成为2027年增长最快的开源AI项目之一。Hugging Face已将Hall集成到其推理API的默认配置中，用户可一键启用事实性校验功能。

微软Azure AI副总裁Sarah Bird在社交平台上表示："Hall填补了AI安全工具链中的关键空白。我们正在评估将Hall集成到Azure AI服务中的可行性。"

不过，Hall也面临一些技术局限。DeepSeek在技术报告中坦承，Hall在涉及高度专业化领域（如前沿医学研究、小语种文化知识）的事实校验中表现较弱，误拦截率（将正确信息标记为错误）约为8.5%。此外，知识图谱的更新滞后意味着对于最新事件的校验存在时间窗口漏洞。

"反幻觉不是终点，而是起点，"高天宇在技术报告的结语中写道，"我们希望Hall能推动整个行业建立更严格的事实性标准。大模型不应只是能说会道，更应该言之有据。"

DeepSeek表示Hall将采用Apache 2.0协议开源，商业使用无限制。

免责声明

内容为AI生成，请勿作为事实或决策依据。转载、引用时请勿当作真实报道。