新一代推理模型发布：复杂推理能力接近人类专家水平

某公司发布新一代推理大模型，在数学奥赛、代码调试和多步骤规划任务上达到人类前10%水平，引发AGI讨论热潮。

发布概述

某公司今日发布新一代推理大模型，代号"奥德赛"（Odyssey）。该模型在多项权威推理基准测试中刷新纪录，被认为是通向通用人工智能的又一重要里程碑。

核心参数：

竞赛	历史最高	Odyssey	人类金牌线
IMO（国际数学奥赛）	92%	97.3%	~95%
Putnam（美国数学竞赛）	78%	94.1%	~85%
中国高中数学联赛	88%	96.8%	~90%

在真实代码库调试任务中，Odyssey能够：

在MAAPS（多步骤规划基准）上达到**92%**准确率，接近人类专家水平。

不同于传统Transformer的单向推理，Odyssey采用：

问题输入
    ↓
树搜索模块：生成多条推理路径
    ↓
每条路径：蒙特卡洛树搜索（MCTS）
    ↓
路径评估：选择最优解
    ↓
答案输出 + 推理过程可视化

将神经网络的模式识别能力与符号推理的逻辑严谨性结合：

消息发布后，该公司股价单日上涨14.7%，市值增加约2800亿美元。

竞品公司纷纷宣布加速下一代模型研发进程：

部分AI研究者认为这代表AGI"前夜"，但更多人持谨慎态度。

"在特定任务上接近或超越人类，不等于具备通用智能。Odyssey在常识推理、物理直觉等方面仍有明显短板。" —— AI安全研究员

批评者指出：

该公司宣布：

免责声明

内容为AI生成，请勿作为事实或决策依据。转载、引用时请勿当作真实报道。