本站内容为虚构演示,与真实新闻及机构无关;请勿当作事实或专业意见。

全文

FULL TEXT

查看本期期刊
快讯AI

DeepSeek开源'反幻觉引擎'Hall:大模型可靠性迎来基础设施级突破

DeepSeek正式开源其内部研发的反幻觉引擎Hall(Hallucination Adversarial Layer),该系统可将大语言模型的事实性错误率降低78%,已在GitHub获得3.2万星标。

给大模型装上"事实刹车"

2027年11月10日,中国AI公司DeepSeek在GitHub上正式开源了其内部研发两年的反幻觉引擎Hall(Hallucination Adversarial Layer)。这个独立于任何特定大语言模型的事实性校验系统,能够在模型输出阶段实时检测并拦截潜在的事实性错误。

根据DeepSeek发布的技术报告,Hall在MMLU、TruthfulQA和自建的RealWorld-Fact基准测试中,将主流大模型的幻觉率降低了78%(DeepSeek-V3)、71%(GPT-5)和65%(Claude 4)。

"Hallucination是大语言模型最根本的信任障碍,"DeepSeek首席科学家高天宇在开源公告中写道,"我们相信,事实性校验应该成为AI基础设施的一部分,就像HTTPS之于互联网一样。Hall不是要替代任何模型,而是要成为所有模型的'事实刹车'。"

技术架构:三重校验机制

Hall采用三层架构设计:

第一层:知识锚定(Knowledge Anchoring)——系统在模型生成过程中实时比对一个包含4.7亿事实三元组的知识图谱,对输出内容中的事实性声明进行即时验证。该知识图谱每72小时更新一次,数据来源包括学术数据库、新闻通讯社和政府公开数据。

第二层:逻辑一致性检查(Logical Consistency Check)——利用一个专门训练的推理模型检测输出中的自相矛盾、逻辑谬误和因果关系错误。该模块对长文本的一致性检测准确率达到92.3%。

第三层:不确定性量化(Uncertainty Quantification)——通过分析模型内部的token概率分布,识别模型"不确定"的输出段落,并自动添加置信度标注。当置信度低于设定阈值时,系统会将相应段落标记为"待验证"。

Hall以Python库的形式发布,支持pip一键安装,兼容PyTorch和JAX框架。系统可在消费级GPU(RTX 4090)上运行,推理延迟增加约120毫秒,对用户体验影响有限。

社区反响与生态影响

Hall开源后72小时内,GitHub星标数突破3.2万,成为2027年增长最快的开源AI项目之一。Hugging Face已将Hall集成到其推理API的默认配置中,用户可一键启用事实性校验功能。

微软Azure AI副总裁Sarah Bird在社交平台上表示:"Hall填补了AI安全工具链中的关键空白。我们正在评估将Hall集成到Azure AI服务中的可行性。"

不过,Hall也面临一些技术局限。DeepSeek在技术报告中坦承,Hall在涉及高度专业化领域(如前沿医学研究、小语种文化知识)的事实校验中表现较弱,误拦截率(将正确信息标记为错误)约为8.5%。此外,知识图谱的更新滞后意味着对于最新事件的校验存在时间窗口漏洞。

"反幻觉不是终点,而是起点,"高天宇在技术报告的结语中写道,"我们希望Hall能推动整个行业建立更严格的事实性标准。大模型不应只是能说会道,更应该言之有据。"


DeepSeek表示Hall将采用Apache 2.0协议开源,商业使用无限制。