本站内容为虚构演示,与真实新闻及机构无关;请勿当作事实或专业意见。

全文

FULL TEXT

查看本期期刊
头条AI

第一性原理推理引擎Principia发布:AI首次展示从基础公理推导复杂结论的能力

AI研究公司Foundation Labs发布Principia推理引擎,不同于传统LLM的模式匹配,Principia展示了从基础公理出发进行多步逻辑推导的能力,在数学定理证明任务中超越人类专家水平

不是记住答案而是推导答案——Principia展示AI的真正推理能力

大语言模型(LLM)在过去几年取得了惊人的进展,但批评者一直指出一个根本性的问题:LLM本质上是在做高级模式匹配,而非真正的推理。它们能给出正确答案,但往往是因为在训练数据中见过类似的问题,而非理解了问题背后的逻辑。

Foundation Labs的Principia引擎试图突破这一限制。4月30日发布的这款推理引擎展示了一种全新的能力——从基础公理出发,通过多步逻辑推导得出复杂结论。

Principia的核心架构被称为「公理推理图」。系统从用户指定的公理集合(数学公理、物理定律或逻辑规则)出发,构建一个推理图谱。每个推理节点代表一个中间结论,每条边代表一个推理步骤。AI通过搜索推理图谱找到从公理到目标结论的最优路径。

「Principia不是在『猜』答案——它在『推导』答案,」Foundation Labs首席科学家Dr. Michael Torres解释道,「每次给出结论时,它都能展示完整的推理链。」

在数学定理证明基准测试中,Principia解决了国际数学奥林匹克竞赛级别问题的78%,超越了人类金牌选手的平均水平(约65%)。更重要的是,Principia的每个解答都附带了完整的、可验证的证明过程。

Principia的应用前景令人兴奋。在药物研发中,Principia可以从分子结构和化学定律出发预测新化合物的性质;在工程设计中,它可以从物理原理出发推导最优设计方案。

但Principia的计算成本远高于传统LLM——一个复杂推理任务可能需要数小时的计算时间。Foundation Labs正在通过专用硬件加速来降低成本。

Principia目前以API形式提供服务,每次推理任务的费用从1美元到100美元不等,取决于问题复杂度。公司已完成A轮融资2亿美元。