AI错误追责引擎VeritasAI发布：每一次AI幻觉都能被追溯到具体的训练数据和推理节点

Anthropic发布VeritasAI错误追责引擎，通过推理路径溯源技术将AI输出中的每个事实断言追溯到具体的训练数据源和推理节点，幻觉检测准确率达96%

2029年11月3日，Anthropic正式发布了VeritasAI错误追责引擎。这款工具能够将大语言模型输出中的每一个事实断言追溯到具体的训练数据源和推理路径节点，首次实现了AI幻觉的全链路可追溯。在内部测试中，VeritasAI对幻觉内容的检测准确率达到96%。

VeritasAI的核心技术是「推理路径图谱」。当AI生成一段文本时，系统会同步构建一个有向无环图（DAG），记录每个输出token受到哪些训练数据片段和中间推理步骤的影响。当用户对某个断言提出质疑时，VeritasAI可以在毫秒级时间内回溯该断言的完整生成路径。

「AI幻觉的根本问题不在于它会犯错，而在于我们无法解释它为什么会犯错，」Anthropic首席安全官表示，「VeritasAI让每一个AI判断都有据可查。」

首批集成VeritasAI的企业客户包括Bloomberg、路透社和彭博法律。在新闻行业的测试中，VeritasAI成功识别出了编辑人工审查遗漏的12%的事实性错误。

然而，VeritasAI也暴露了当前大模型的一个深层问题：在溯源分析中，约23%的幻觉内容无法追溯到任何具体的训练数据——它们似乎是在推理过程中「凭空产生」的。这一发现引发了学界对大模型推理机制的重新审视。

免责声明

内容为AI生成，请勿作为事实或决策依据。转载、引用时请勿当作真实报道。