本站内容为虚构演示,与真实新闻及机构无关;请勿当作事实或专业意见。

全文

FULL TEXT

查看本期期刊
头条AI

零幻觉推理引擎VeritasAI发布:DeepMind与斯坦福联合研发的确定性AI首次通过司法事实核查认证

DeepMind与斯坦福大学联合发布VeritasAI推理引擎,通过形式化数学验证链实现零幻觉输出,已获美国联邦法院事实核查工具认证。

文章正文

2030年5月24日,DeepMind与斯坦福大学人工智能实验室在《Nature Machine Intelligence》上联合发表论文,正式发布零幻觉推理引擎VeritasAI。这款推理系统采用形式化数学验证链架构,能够在每次输出前自动回溯推理路径并验证每一步逻辑的数学正确性。

VeritasAI的核心技术突破在于「确定性推理图谱」。与传统大语言模型基于概率生成答案不同,VeritasAI在推理过程中构建一个有向无环图(DAG),每个节点对应一个可验证的逻辑命题,每条边标注置信度和推理规则来源。当用户提出问题时,系统先将自然语言转换为形式化逻辑表达式,再沿着验证图谱进行确定性推理。

斯坦福大学计算机科学教授、项目负责人之一的Chris Manning在接受采访时表示:「过去三年,AI幻觉问题从技术缺陷变成了社会信任危机。VeritasAI的思路不是修补幻觉,而是从架构层面消灭幻觉的可能性。」

技术细节方面,VeritasAI由三个核心模块组成:FormalEngine(形式化推理引擎)、ClaimVerifier(断言验证器)和RefChecker(参考文献交叉检验器)。FormalEngine基于Lean 4定理证明器构建,能够将自然语言命题自动翻译为形式化逻辑语言。ClaimVerifier则连接了一个包含超过50亿条经过人工验证的事实知识图谱,确保每条输出都有可追溯的信息来源。

美国联邦第九巡回上诉法院成为VeritasAI的首个官方认证机构。法院在认证声明中指出,VeritasAI在连续六个月的测试中,对法律文书的事实核查准确率达到99.97%,远超人类法律助理的平均准确率(约92%)。

然而,VeritasAI的局限性同样明显。DeepMind在论文中坦承,该系统在处理需要创造性推理或价值判断的问题时表现不佳。由于依赖形式化验证,VeritasAI的推理速度比传统大语言模型慢约40倍,单次查询平均需要12秒完成验证。此外,知识图谱的维护成本极高,每周需要投入约200人时进行数据更新和验证。

麻省理工学院人工智能实验室主任Daniela Rus评论称:「VeritasAI代表了AI可信性的一个里程碑,但它的适用场景相对狭窄。未来的方向可能是将确定性推理与概率生成相结合,让AI在不同场景下自动切换推理模式。」

目前,VeritasAI已开放学术机构免费使用API,企业版本定价为每千次查询47美元。预计到2030年底,将有超过200家法律、医疗和金融机构接入该系统。