Nexus AI Labs 发布 Cascade 推理引擎:让 AI 在开口前先思考
Nexus AI Labs 推出名为 Cascade 的推理引擎架构,能在生成回复前预先构建逻辑推理链,在独立基准测试中将事实错误率降低 73%。
旧金山 — 企业 AI 竞争格局可能因此被重塑。Nexus AI Labs 正式发布 Cascade,这是一种全新的推理架构,从根本上改变了大型语言模型在产生输出前处理查询的方式。
与传统的逐token顺序生成模型不同,Cascade 引入了 Nexus 称之为"认知预通行"(cognitive pre-pass)的机制——在写出一个回复词之前,模型先构建一个显式的逻辑依赖图。只有当这个图通过模型内部知识库的验证后,生成阶段才会开始。
Cascade 的工作原理
该架构由三个顺序运行的独立模块组成。首先,分解引擎(Decomposition Engine)将用户查询拆解为原子级的子问题。其次,推理链构建器(Inference Chain Builder)映射这些子问题之间的逻辑关系,并为每个节点标注置信度。最后,一致性验证器(Consistency Verifier)将提议的推理链与模型权重中存在的矛盾信号进行交叉比对,在输出阶段之前标记出可能产生幻觉的内容。
经过验证的推理链随后作为回复生成器的脚手架结构,确保每个事实陈述都能追溯到推理图中一个已验证的节点。
基准测试结果
Nexus 将 Cascade 提交给了三个独立评估体系。在 TruthfulQA 上,该系统得分为 94.2%,而同类无推理脚手架模型的平均得分仅为 78.6%。在 HumanEval 的事实一致性子集上,Cascade 达到了 89.7%,相比 Nexus 上一代模型,经验证的事实错误率降低了 73%。
最令人印象深刻的是,该系统展现了研究人员所称的"优雅不确定性"——当推理链遇到置信度低于可配置阈值(默认值为 0.6)的节点时,Cascade 会明确标记这一知识空白,而非含糊其辞或编造内容。
企业采用已悄然启动
多家《财富》500 强企业参与了封闭测试。金融服务公司 Morgan & Associates 将 Cascade 部署于其研究分析流程,据报告下游事实核查工作量减少了 41%。医疗网络 VitaLink 将该引擎整合入临床决策支持工具,而该工具的显式不确定性标记功能已成为美国食品药品监督管理局(FDA)新型 AI 辅助诊断指南下的合规要求。
该模型现已通过 API 提供,计费方式为按 token 计费,同时为受监管行业提供本地化部署选项。
这对行业意味着什么
这一发布代表了对大语言模型最持久批评之一——幻觉问题——的一个具体工程答案。Cascade 不是依赖事后微调或检索增强生成来减轻错误,而是在推理过程中本身就内置了正确性保障。竞争对手预计将在数周内宣布应对架构。
Nexus AI Labs 由前 DeepMind 和 OpenAI 研究人员于 2025 年创立,已完成 3.4 亿美元 B 轮融资。公司表示 Cascade 是其规划中一系列"认知原理主义"AI 系统的首款产品。
NextPaper 将持续关注 AI 推理架构及企业部署的最新进展。
免责声明
内容为AI生成,请勿作为事实或决策依据。转载、引用时请勿当作真实报道。