Synthos AI发布Causa协议:优先考虑因果链而非统计相关性的人工智能推理新标准
AI研究实验室Synthos AI开源了Causa协议,这是一种新颖的推理框架,在结构化AI输出时优先考虑显性因果链而非统计共现——基准测试显示,在复杂多跳查询中幻觉率降低了34%。
一个新开源推理框架正在挑战大型语言模型设计中的主导范式。总部位于伦敦的四年AI研究实验室Synthos AI已在GitHub上发布了Causa协议规范和参考实现,提供了一种从根本上不同的方法来构建AI系统的推理结构。
当今的标准语言模型——无论规模大小——都经过训练,可以根据上下文窗口预测下一个最可能的token。这导致系统在识别训练数据中的统计模式方面表现出色,但在这些模式失效时会出现众所周知的错误倾向。结果就是被广泛记录的幻觉问题:模型生成流畅、看似合理的文本,但事实错误。
因果关系而非相关性
Causa协议引入了一个名为因果图推理引擎的结构化表示层。配备Causa的模型不是从统计分布中逐token生成响应,而是首先构建查询中提到的实体之间的显性因果关系图,然后通过遍历和报告该图来生成响应。
该协议在三个阶段运行:解析(提取因果实体及其关系)、图构建(构建因果依赖的有向无环图)和响应综合(通过读取图而非预测下一个token来生成文本)。
在涵盖医学诊断、法律推理和科学文献综合的基准测试中,使用Causa增强的模型在复杂多跳查询(需要两个或多个顺序推理的查询)上与未修改基线相比,事实幻觉减少了34%。在单跳事实回忆任务上,性能与标准模型相当。
开源核心
Synthos已根据Apache 2.0许可证发布协议规范,并为几个开源模型架构提供参考实现,包括Llama 3和Mistral的指令调整变体。该公司还发布了一个包含120,000条注释的因果推理轨迹数据集,旨在微调模型遵循协议的表示格式。
联合创始人阿马拉·奥塞伊博士(Dr. Amara Osei)表示:"我们选择开源是深思熟虑的。我们相信因果推理是一项基础能力,而非竞争优势。如果这成为标准,每个人都受益——包括我们自己。"
早期社区反响热烈。GitHub仓库在最初72小时内获得了14,000颗星。几位独立研究人员已开始复现基准测试结果,初始确认出现在Hugging Face上。
局限性和开放问题
Causa协议并非没有批评者。一些研究人员指出,因果图构建本身需要准确的世界知识——如果模型从错误前提构建因果图,它将产生自信但错误的结论,只是通过不同的路线。其他人观察到图构建阶段增加了有意义的推理延迟,早期基准显示每个查询的计算成本增加了2.1倍。
Synthos团队在技术文档中承认了这两个问题,表示图构建质量将随着协议成熟而提高,延迟优化是路线图优先事项。
免责声明
内容为AI生成,请勿作为事实或决策依据。转载、引用时请勿当作真实报道。